You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
tde-i18n/tde-i18n-ru/docs/tdebase/kate/highlighting.docbook

631 lines
58 KiB

<appendix id="highlight">
<appendixinfo>
<authorgroup>
<author><personname><firstname></firstname></personname></author>
<othercredit role="translator"><firstname>Андрей</firstname><surname>Балагута</surname><affiliation><address><email>uj2@mail.ru</email></address></affiliation><contrib>Перевод на русский</contrib></othercredit><othercredit role="translator"><firstname>Алексей</firstname><surname>Опарин</surname><affiliation><address><email>opaleksej@yandex.ru</email></address></affiliation><contrib>Перевод на русский</contrib></othercredit>
</authorgroup>
</appendixinfo>
<title>Подсветка синтаксиса</title>
<sect1 id="highlight-overview">
<title>Обзор</title>
<para>Синтаксическая подсветка позволяет отображать текст в редакторе разными цветами и стилями, таким образом отделяя одни синтаксические понятия от других. Например, в исходном тексте программы можно ключевые слова выделить полужирным шрифтом, а типы данных и комментарии отображать разными цветами, выделяя их из основного текста. Это улучшает читаемость документа и повышает продуктивность работы автора.</para>
<mediaobject>
<imageobject><imagedata format="PNG" fileref="highlighted.png"/></imageobject>
<textobject><phrase>Функция Perl, отображенная с использованием синтаксической подсветки.</phrase></textobject>
<caption><para>Функция Perl, отображенная с использованием синтаксической подсветки.</para>
</caption>
</mediaobject>
<mediaobject>
<imageobject><imagedata format="PNG" fileref="unhighlighted.png"/></imageobject>
<textobject><phrase>Та же самая функция, но без подсветки.</phrase></textobject>
<caption><para>Та же самая функция, но без подсветки.</para></caption>
</mediaobject>
<para>Какой из примеров легче читать?</para>
<para>&kate; имеет гибкую, легко настраиваемую систему синтаксической подсветки, в стандартную поставку редактора входят правила подсветки синтаксиса для большого числа языков программирования, разметки и других текстовых форматов. Все определения хранятся в простых текстовых файлах в формате &XML;, поэтому вы можете свободно создавать собственные правила.</para>
<para>При открытии файла &kate; автоматически подбирает правила подсветки, основываясь на &MIME;-типе (который, в свою очередь, определяется расширением файла) или содержании файла, если расширения нет. Если &kate; неправильно определил тип файла, выберите нужный режим подсветки вручную в меню <menuchoice><guimenu>Документ</guimenu><guisubmenu>Режим подсветки</guisubmenu></menuchoice>.</para>
<para>Вы можете настроить стили и цвета доступных синтаксических определений на вкладке <link linkend="config-dialog-editor-appearance">Схемы</link>диалога <link linkend="config-dialog">Настройка &kate;</link> , а соответствующие им &MIME;-типы - на вкладке <link linkend="config-dialog-editor-highlighting">Подсветка</link> .</para>
<note>
<para>Синтаксическая подсветка улучшает читаемость корректно оформленного текста, но не факт, что текст некорректен, если он неправильно отображается системой подсветки. Синтаксическая разметка текста - достаточно сложный процесс, сложность которого зависит от формата файла, поэтому авторы синтаксических определений считают удачей, если 98% текста отображается корректно, но не стоит забывать об оставшихся 2%.</para>
</note>
<tip>
<para>На сайте &kate; вы можете загрузить обновлённые или дополнительные правила синтаксической подсветки. Для этого нужно щёлкнуть на кнопке <guibutton>Загрузить</guibutton> на вкладке <link linkend="config-dialog-editor-highlighting">Подсветка</link> диалога <link linkend="config-dialog">Настройка &kate;</link>.</para>
</tip>
</sect1>
<sect1 id="katehighlight-system">
<title>Система синтаксической подсветки &kate;</title>
<para>В этом разделе подробно рассматривается механизм синтаксической подсветки &kate;. Прочитав его, вы сможете изменять существующие или создавать свои синтаксические определения.</para>
<sect2 id="katehighlight-howitworks">
<title>Механизм работы</title>
<para>Когда вы открываете файл, первое, что делает &kate; - определяет, какое синтаксическое определение использовать для него. При чтении и наборе система подсветки анализирует текст в редакторе, используя правила, указанные в синтаксическом определении, и помечает границы контекстов и стилей.</para>
<para>При вводе система динамически анализирует текст, поэтому, если вы удалите символ, который был помечен как начало или конец контекста, стиль окружающего текста автоматически изменится.</para>
<para>Синтаксические определения &kate; хранятся в &XML;-файлах. Они содержат: <itemizedlist>
<listitem><para>Правила определения роли текста, организованного в контекстные блоки</para></listitem>
<listitem><para>Списки ключевых слов</para></listitem>
<listitem><para>Определения стилей</para></listitem>
</itemizedlist>
</para>
<para>Система подсветки анализирует текст последовательно от начала до конца. Указатель анализатора перемещается от символа к символу, проверяя текст на соответствие правилам и помечая границы контекстов. Правила применяются к текущей строке в порядке их объявления, и при соответствии к ней применяется контекст, указанный в правиле. После этого указатель смещается на конец области соответствия и начинается новый цикл проверки правил, принадлежащих установленному контексту.</para>
</sect2>
<sect2 id="highlight-system-rules">
<title>Правила</title>
<para>Правила - это сердце системы подсветки. Правило может быть строкой, символом или <link linkend="regular-expressions">регулярным выражением</link>, с которым сравнивается текст документа. Оно содержит информацию о стиле, который будет применен к тексту, если последний соответствует правилу. Оно может переключить текущий контекст системы на явно указанный или предыдущий контекст.</para>
<para>Правила организованы в контекстные группы. Контекстная группа используется для определения главных понятий в формате, например, строка, заключенная в двойные кавычки, или блок комментария в исходном тексте программы. Такая организация правил позволяет предотвратить проверку правил, неприменимых к текущему контексту (правил из других контекстов). Эта структура делает систему подсветки более гибкой, позволяя определять одинаковые правила в разных контекстах, что делает возможным одинаковые последовательности символов отображать разными стилями в зависимости от контекста, в котором они находятся. </para>
<para>Контексты могут образовываться динамически, чтобы сделать возможным использование правил, справедливых для данного момента.</para>
</sect2>
<sect2 id="highlight-context-styles-keywords">
<title>Стили контекстов и ключевые слова</title>
<para>В некоторых языках программирования целые и вещественные числа трактуются компилятором по-разному (компилятор - это программа, которая преобразует исходный текст программы в двоичный исполняемый файл). Синтаксис языка может определять символы, имеющие специальное значение, если они находятся в строке, заключенной в кавычки. В этих случаях есть смысл выделять их в тексте для более удобного чтения. Иногда бывает полезно выделять символы, не имеющие специального значения - это тоже под силу системе синтаксической подсветки &kate;.</para>
<para>Синтаксическое определение может содержать столько стилей, сколько нужно для данного формата.</para>
<para>Во многих форматах существуют списки слов, имеющих специальное значение. Например, в языках программирования такими словами будут являться управляющие операторы, названия типов данных и встроенные функции. Это концептуальные слова, поскольку они определяют саму суть синтаксиса. Система синтаксической подсветки &kate; использует списки подобных слов, чтобы подчеркнуть концептуальные элементы формата.</para>
</sect2>
<sect2 id="kate-highlight-system-default-styles">
<title>Стили по умолчанию</title>
<para>Если вы откроете файл исходного кода на C++, на &Java; или документ <acronym>HTML</acronym>, то увидите, что разные форматы отображаются в одних и тех же цветах. Дело в том, что &kate; содержит предустановленный набор стандартных стилей. Синтаксические определения по возможности используют этот набор.</para>
<para>Это позволяет подобным образом отображать похожие концепции в различных форматах. Например, комментарии есть почти во всех языках программирования, разметки и скриптах.</para>
<tip>
<para>Каждый стиль в синтаксическом определении основывается на одном из стандартных стилей. Поэтому, если вы часто используете какой-то формат с большим количеством стилей, следует проверить его конфигурацию на предмет их совпадения. Приведём небольшой пример. В &kate; определен всего один стандартный стиль для отображения строковых констант, но в языке программирования Perl существует два вида строк. Согласитесь, было бы гораздо лучше отображать их по разному - вы заходите в диалоговое окно настройки &kate; и изменяете соответствующие стили. Все <link linkend="kate-highlight-default-styles">доступные стандартные стили</link> будут рассмотрены позже.</para>
</tip>
</sect2>
</sect1>
<sect1 id="katehighlight-xml-format">
<title>&XML;-формат определения синтаксической подсветки</title>
<sect2>
<title>Обзор</title>
<para>В этом разделе вы познакомитесь с &XML;-форматом определения синтаксической подсветки. Вначале, на небольшом примере, будут кратко объяснены главные компоненты и их значение, затем мы более подробно остановимся на правилах подсветки.</para>
<para>Формальное определение (<acronym>DTD</acronym>) находится в файле <filename>language.dtd</filename>, в каталоге <filename>$<envar>TDEDIR</envar>/share/apps/katepart/syntax</filename>. </para>
<variablelist>
<title>Основные разделы файла определения синтаксической подсветки &kate;</title>
<varlistentry>
<term>В заголовке файла подсветки указаны версия XML и тип документа:</term>
<listitem>
<programlisting>&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&gt;
&lt;!DOCTYPE language SYSTEM &quot;language.dtd&quot;&gt;
</programlisting>
</listitem>
</varlistentry>
<varlistentry>
<term>Главная часть файла определений - элемент <userinput>language</userinput>. Доступные атрибуты:</term>
<listitem>
<para>Необходимые атрибуты:</para>
<para><userinput>name</userinput> определяет название языка. Впоследствии оно появляется во всех меню и диалогах.</para>
<para><userinput>section</userinput> указывает категорию.</para>
<para><userinput>extensions</userinput> определяет расширения файлов, вроде &quot;*.cpp;*.h&quot;</para>
<para>Дополнительные атрибуты:</para>
<para><userinput>mimetype</userinput> связывает файл с определенным типом &MIME;.</para>
<para><userinput>version</userinput> указывает текущую версию файла определений.</para>
<para><userinput>kateversion</userinput> указывает новейшую из поддерживаемых версий &kate;.</para>
<para><userinput>casesensitive</userinput> определяет чувствительность ключевых слов к регистру.</para>
<para><userinput>priority</userinput> определяет приоритет в случае использования разных правил подсветки. Действует правило с высшим приоритетом.</para>
<para><userinput>author</userinput> содержит имя и email-адрес автора.</para>
<para><userinput>license</userinput> содержит лицензию, обычно LGPL, Artistic, GPL и т.п.</para>
<para><userinput>hidden</userinput> определяет, будет ли отображаться название в меню &kate;.</para>
<para>Итак, следующая строка может быть примерно такой:</para>
<programlisting>&lt;language name=&quot;C++&quot; version=&quot;1.00&quot; kateversion=&quot;2.4&quot; section=&quot;Sources&quot; extensions=&quot;*.cpp;*.h&quot; /&gt;
</programlisting>
</listitem>
</varlistentry>
<varlistentry>
<term>Следующий элемент - <userinput>highlighting</userinput>, состоящий из необязательного <userinput>list</userinput> и обязательных - <userinput>contexts</userinput> и <userinput>itemDatas</userinput>.</term>
<listitem>
<para>Элемент <userinput>list</userinput> содержит список ключевых слов. В нашем случае это <emphasis>class</emphasis> и <emphasis>const</emphasis>.Списков можете добавить, сколько хотите.</para>
<para>Элемент <userinput>contexts</userinput> содержит все контексты. По умолчанию, подсветка начинается с первого контекста. В контексте <emphasis>Normal Text</emphasis> есть два правила, одно из которых проверяет наличие в тексте <emphasis>слов</emphasis>, соответствующих списку ключевых слов, другое определяет наличие кавычек и переключает контекст к <emphasis>строковому</emphasis> типу. Подробнее правила описаны в следующей главе.</para>
<para>Элемент <userinput>itemDatas</userinput> содержит сведения о цветах и стилях, применяющихся в контекстах и правилах. В нашем примере <userinput>itemData</userinput> использует контексты <emphasis>Normal Text</emphasis>, <emphasis>String</emphasis> и <emphasis>Keyword</emphasis>. </para>
<programlisting>&lt;highlighting&gt;
&lt;list name=&quot;somename&quot;&gt;
&lt;item&gt; class &lt;/item&gt;
&lt;item&gt; const &lt;/item&gt;
&lt;/list&gt;
&lt;contexts&gt;
&lt;context attribute=&quot;Normal Text&quot; lineEndContext=&quot;#pop&quot; name=&quot;Normal Text&quot; &gt;
&lt;keyword attribute=&quot;Keyword&quot; context=&quot;#stay&quot; String=&quot;somename&quot; /&gt;
&lt;DetectChar attribute=&quot;String&quot; context=&quot;string&quot; char=&quot;&amp;quot;&quot; /&gt;
&lt;/context&gt;
&lt;context attribute=&quot;String&quot; lineEndContext=&quot;#stay&quot; name=&quot;string&quot; &gt;
&lt;DetectChar attribute=&quot;String&quot; context=&quot;#pop&quot; char=&quot;&amp;quot;&quot; /&gt;
&lt;/context&gt;
&lt;/contexts&gt;
&lt;itemDatas&gt;
&lt;itemData name=&quot;Normal Text&quot; defStyleNum=&quot;dsNormal&quot; /&gt;
&lt;itemData name=&quot;Keyword&quot; defStyleNum=&quot;dsKeyword&quot; /&gt;
&lt;itemData name=&quot;String&quot; defStyleNum=&quot;dsString&quot; /&gt;
&lt;/itemDatas&gt;
&lt;/highlighting&gt;
</programlisting>
</listitem>
</varlistentry>
<varlistentry>
<term> Последня часть файла определения синтаксической подсветки - необязательный раздел <userinput>general</userinput>. Здесь могут содержаться сведения о ключевых словах, сворачивании блоков кода, комментариях и отступах.</term>
<listitem>
<para>Раздел <userinput>comment</userinput> определяет, какой строкой вводится однострочный комментарий. Можно пользоваться также многострочными комментариями, используя <emphasis>multiLine</emphasis> с дополнительным атрибутом <emphasis>end</emphasis>. Это используется тогда, когда пользователь нажимает комбинацию клавиш, назначенную для действия <emphasis>закомментировать/раскомментировать</emphasis>.</para>
<para>Секция <userinput>keywords</userinput> определяет чувствительность ключевых слов к регистру. Остальные атрибуты рассмотрим позднее.</para>
<programlisting>&lt;general&gt;
&lt;comments&gt;
&lt;comment name="singleLine" start="#"/&gt;
&lt;/comments&gt;
&lt;keywords casesensitive="1"/&gt;
&lt;/general&gt;
&lt;/language&gt;
</programlisting>
</listitem>
</varlistentry>
</variablelist>
</sect2>
<sect2 id="kate-highlight-sections">
<title>Более подробно о разделах</title>
<para>В этой части указаны все возможные атрибуты для контекстов, itemDatas, ключевых слов, комментариев, сворачивания кодов и отступов.</para>
<variablelist>
<varlistentry>
<term>Элемент <userinput>context</userinput> относится к группе <userinput>contexts</userinput>. Контекстом определяются некоторые особые правила (например, что происходит при достижении подсвеченной структурой конца строки). Доступные атрибуты:</term>
<listitem>
<para><userinput>name</userinput> - название контекста. Правила используют это название для переключения на указанный контекст.</para>
<para><userinput>lineEndContext</userinput> определяет, на какой контекст подсвеченная структура переключается при достижении конца строки. Это может быть название другого контекста, <userinput>#stay</userinput>, если контекст не меняется (т.е. не делать ничего) или <userinput>#pop</userinput> для выхода из контекста. Например, набор <userinput>#pop#pop#pop</userinput> приведет к троекратному выходу из контекста.</para>
<para><userinput>lineBeginContext</userinput> определяет контекст при достижении начала строки. По умолчанию: #stay.</para>
<para><userinput>fallthrough</userinput> определяет поведение в случае переключения подсвеченной структуры на контекст, указанный в fallthroughContext, если не найдено соответствующее правило. По умолчанию: <emphasis>false</emphasis>.</para>
<para><userinput>fallthroughContext</userinput> указывает следующий контекст, если не найдено соответствующее правило.</para>
<para>Если <userinput>dynamic</userinput> имеет значение <emphasis>true</emphasis>, то контекст запоминает строки/метки-заполнители, сохранённые в динамических правилах. Это необходимо, например, для текущих документов. По умолчанию: <emphasis>false</emphasis>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>Элемент <userinput>itemData</userinput> принадлежит группе <userinput>itemDatas</userinput>. Он определяет стиль и цвет шрифта, их можно устанавливать самому в тех случаях, когда это необходимо. И все же, рекомендуется придерживаться стандартных стилей, чтобы помочь пользователю свободно ориентироваться в любом языке . Название атрибута (name) и defStyleNum обязательны, остальные нет. Доступные атрибуты:</term>
<listitem>
<para><userinput>name</userinput> даёт название itemData. Контексты и правила будут использовать это название при обращении к itemData в своих атрибутах <emphasis>attribute</emphasis>.</para>
<para><userinput>defStyleNum</userinput> определяет стиль, используемый по умолчанию. Доступные стандартные стили будут детально описаны ниже.</para>
<para><userinput>color</userinput> определяет цвет. Правильные форматы '#rrggbb' или '#rgb'.</para>
<para><userinput>selColor</userinput> определяет цвет выделенного текста.</para>
<para>Если <userinput>italic</userinput> имеет значение <emphasis>true</emphasis>, шрифт будет курсивным.</para>
<para>Если <userinput>bold</userinput> имеет значение <emphasis>true</emphasis>, шрифт будет полужирным.</para>
<para>Если <userinput>underline</userinput> имеет значение <emphasis>true</emphasis>, текст будет подчёркнут.</para>
<para>Если <userinput>strikeout</userinput> имеет значение <emphasis>true</emphasis>, текст будет зачёркнут.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>Элемент <userinput>keywords</userinput> в группе <userinput>general</userinput> определяет свойства ключевых слов. Доступные атрибуты:</term>
<listitem>
<para><userinput>casesensitive</userinput> может быть <emphasis>true</emphasis> или <emphasis>false</emphasis>. Если <emphasis>true</emphasis>, все ключевые слова будут проверяться на соответствие с учетом регистра</para>
<para><userinput>weakDeliminator</userinput> - это группа знаков, которые не могут разделять слова. Например, точка <userinput>'.'</userinput> - разделитель слов. Если ключевое слово в <userinput>list</userinput> содержит точку, оно будет использовано по назначению только, если точка будет определена как "нетвердый разделитель" (weak delimiter).</para>
<para><userinput>additionalDeliminator</userinput> определяют дополнительные разделители.</para>
<para><userinput>wordWrapDeliminator</userinput> определяют символы, после которых может происходить перевод строки.</para>
<para>По умолчанию разделителями слов и строк являются символы <userinput>.():!+,-&lt;=&gt;%&amp;*/;?[]^{|}~\</userinput>, пробел (<userinput>' '</userinput>) и табуляция (<userinput>'\t'</userinput>).</para>
</listitem>
</varlistentry>
<varlistentry>
<term>Элемент <userinput>comment</userinput> в группе <userinput>comments</userinput> определяет свойства комментариев, которые используются в меню<menuchoice><guimenu>Сервис</guimenu><guimenuitem>Закомментировать</guimenuitem></menuchoice> и <menuchoice><guimenu>Сервис</guimenu><guimenuitem>Раскомментировать</guimenuitem></menuchoice>. Доступные атрибуты:</term>
<listitem>
<para><userinput>name</userinput> может быть <emphasis>singleLine</emphasis> или <emphasis>multiLine</emphasis>. Если выбрать <emphasis>multiLine</emphasis>, то потребуются атрибуты <emphasis>end</emphasis> и <emphasis>region</emphasis>.</para>
<para><userinput>start</userinput> указывает строку начала комментария. В C++ это может быть &quot;/*&quot;.</para>
<para><userinput>end</userinput> указывает строку окончания комментария. В C++ это может быть &quot;*/&quot;.</para>
<para><userinput>region</userinput> должно быть названием сворачиваемого многострочного комментария. Допустим, если в ваших правилах указано <emphasis>beginRegion="Comment"</emphasis> ... <emphasis>endRegion="Comment"</emphasis>, вы должны использовать <emphasis>region="Comment"</emphasis>. В этом случае раскомментирование будет действовать, даже если не будет выделен весь текст многострочного комментария. Достаточно будет просто поместить курсор в его пределы.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>Элемент <userinput>folding</userinput> в группе <userinput>general</userinput> определяет свойства сворачивания кода. Доступные атрибуты:</term>
<listitem>
<para>Если <userinput>indentationsensitive</userinput> имеет значение <emphasis>true</emphasis>, то маркёры сворачивания кода будут располагаться с учетом отступов, как в языке сценариев Python. Чаще всего в этом нет необходимости, поэтому по умолчанию этот параметр определен как <emphasis>false</emphasis>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>Элемент <userinput>indentation</userinput> в группе <userinput>general</userinput> определяет формат отступов, однако мы настоятельно рекомендуем не менять этот элемент, так как отступы обычно определяются типом файла или добавлением режимной строки в текстовый файл. Если вы всё-таки укажете способ отступа, он может оказаться навязанным пользователю, которому совсем не нужен. Доступные атрибуты:</term>
<listitem>
<para><userinput>mode</userinput> - название формата отступов. Доступные форматы: <emphasis>normal, cstyle, csands, xml, python</emphasis> и <emphasis>varindent</emphasis>.</para>
</listitem>
</varlistentry>
</variablelist>
</sect2>
<sect2 id="kate-highlight-default-styles">
<title>Стандартные стили</title>
<para>Стандартные стили уже были кратко <link linkend="kate-highlight-system-default-styles">описаны</link>: Стандартные стили предопределяют настройки цветов и шрифтов.</para>
<variablelist>
<varlistentry>
<term>Здесь приведен только список доступных стандартных стилей:</term>
<listitem>
<para><userinput>dsNormal</userinput>, для нормального текста.</para>
<para><userinput>dsKeyword</userinput>, для ключевых слов.</para>
<para><userinput>dsDataType</userinput>, для типов данных.</para>
<para><userinput>dsDecVal</userinput>, для десятичных значений.</para>
<para><userinput>dsBaseN</userinput>, для значений с основанием, отличным от10.</para>
<para><userinput>dsFloat</userinput>, для значений с плавающей точкой.</para>
<para><userinput>dsChar</userinput>, для символов.</para>
<para><userinput>dsString</userinput>, для строк.</para>
<para><userinput>dsComment</userinput>, для комментариев.</para>
<para><userinput>dsOthers</userinput>, для всего остального.</para>
<para><userinput>dsAlert</userinput>, для вывода предупреждений.</para>
<para><userinput>dsFunction</userinput>, для вызова функций.</para>
<para><userinput>dsRegionMarker</userinput>, для маркёров участков.</para>
<para><userinput>dsError</userinput>, для подсветки ошибок и неверного синтаксиса.</para>
</listitem>
</varlistentry>
</variablelist>
</sect2>
</sect1>
<sect1 id="kate-highlight-rules-detailled">
<title>Синтаксические правила</title>
<para>В этом разделе описываются синтаксические правила.</para>
<para>При анализе строки каждое правило может <quote>запросить</quote> на проверку любое количество символов (даже ноль). Если правило подходит, к соответствующим символам применяется стиль или <emphasis>атрибут</emphasis>, определённый в правиле. Применяемое правило также может запросить переключение текущего контекста.</para>
<para>Правило выглядит примерно так:</para>
<programlisting>&lt;RuleName attribute=&quot;(identifier)&quot; context=&quot;(identifier)&quot; [rule specific attributes] /&gt;</programlisting>
<para>Параметр <emphasis>attribute</emphasis> указывает, какой стиль применить к символам, соответствующим правилу. Параметр <emphasis>context</emphasis> определяет контекст, который будет установлен в случае применения правила.</para>
<para>Параметр <emphasis>context</emphasis> может принимать следующие значения:</para>
<itemizedlist>
<listitem>
<para><emphasis>Идентификатор</emphasis>, т.е. название контекста.</para>
</listitem>
<listitem>
<para><emphasis>order</emphasis> предписывает системе подсветки не менять текущий контекст (<userinput>#stay</userinput>) или вернуться к предыдущему контексту (<userinput>#pop</userinput>).</para>
<para>Чтобы вернуться назад на несколько контекстов, повторите нужное количество раз ключевое слово #pop: <userinput>#pop#pop#pop</userinput></para>
</listitem>
</itemizedlist>
<para>Некоторые правила могут иметь <emphasis>дочерние правила</emphasis>, которые проверяются только в том случае, если текст соответствует родительскому правилу. Всей совпавшей строке будут присвоены атрибуты, определенные в родительском правиле. Вот пример правила с дочерними правилами:</para>
<programlisting>&lt;RuleName (attributes)&gt;
&lt;ChildRuleName (attributes) /&gt;
...
&lt;/RuleName&gt;
</programlisting>
<para>Параметры конкретных видов правил описаны в следующих разделах.</para>
<itemizedlist>
<title>Общие атрибуты</title>
<para>У любого правила есть следующие атрибуты, <userinput>(common attributes)</userinput>, доступные всегда. <emphasis>attribute</emphasis> и <emphasis>context</emphasis> обязательны, остальные - нет. </para>
<listitem>
<para><emphasis>attribute</emphasis>: Атрибут, описывающий определённые <emphasis>itemData</emphasis>.</para>
</listitem>
<listitem>
<para><emphasis>context</emphasis>: Определяет контекст, на который происходит переключение в случае соответствия правилу.</para>
</listitem>
<listitem>
<para><emphasis>beginRegion</emphasis>: Начало сворачиваемого блока кода. По умолчанию: не установлен (unset).</para>
</listitem>
<listitem>
<para><emphasis>endRegion</emphasis>: Окончание сворачиваемого блока кода. По умолчанию: не установлен (unset).</para>
</listitem>
<listitem>
<para>Если <emphasis>lookAhead</emphasis> имеет значение <emphasis>true</emphasis>, то система подсветки больше не будет обрабатывать соответствия. По умолчанию: <emphasis>false</emphasis>.</para>
</listitem>
<listitem>
<para><emphasis>firstNonSpace</emphasis>: Соответствие, только если строка начинается не с пробела. По умолчанию: <emphasis>false</emphasis>.</para>
</listitem>
<listitem>
<para><emphasis>column</emphasis>: Соответствие, только если соответствует номер столбца. По умолчанию: не установлено (unset).</para>
</listitem>
</itemizedlist>
<itemizedlist>
<title>Динамические правила</title>
<para>У некоторых правил есть необязательный атрибут <userinput>dynamic</userinput>, имеющий логическое значение (по умолчанию <emphasis>false</emphasis>). Если dynamic установить <emphasis>true</emphasis>, то правило может использовать метки-заполнители, заменяющие текст, соответствующий правилу <emphasis>регулярного выражения</emphasis>, переключенного к текущему контексту по своим атрибутам <userinput>string</userinput> или <userinput>char</userinput>. В атрибуте <userinput>string</userinput> метка-заполнитель <replaceable>%N</replaceable> (где N - цифра) будет заменена номером <replaceable>N</replaceable> найденного регулярного выражения. В атрибуте <userinput>char</userinput> метка-заполнитель должна быть цифрой <replaceable>N</replaceable>, и будет заменена первым символом <replaceable>N</replaceable> найденного регулярного выражения. Чтобы правило могло использовать эти атрибуты, оно должно содержать параметр <emphasis>(dynamic)</emphasis>.</para>
<listitem>
<para><emphasis>dynamic</emphasis>: логический атрибут <emphasis>(true|false)</emphasis>.</para>
</listitem>
</itemizedlist>
<sect2 id="highlighting-rules-in-detail">
<title>Более подробно о правилах</title>
<variablelist>
<varlistentry>
<term>DetectChar</term>
<listitem>
<para>Проверка на совпадение с одним определенным символом. Используется, например, для определения завершающего символа строки, заключённой в кавычки.</para>
<programlisting>&lt;DetectChar char=&quot;(character)&quot; (common attributes) (dynamic) /&gt;</programlisting>
<para>Параметр <userinput>char</userinput> определяет символ.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>Detect2Chars</term>
<listitem>
<para>Проверка на совпадение с двумя символами в заданном порядке.</para>
<programlisting>&lt;Detect2Chars char=&quot;(character)&quot; char1=&quot;(character)&quot; (common attributes) (dynamic) /&gt;</programlisting>
<para>Параметр <userinput>char</userinput> определяет первый символ для проверки, <userinput>char1</userinput> - второй.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>AnyChar</term>
<listitem>
<para>Проверка на совпадение с любым символом из заданного набора.</para>
<programlisting>&lt;AnyChar String=&quot;(string)&quot; (common attributes) /&gt;</programlisting>
<para>Параметр <userinput>String</userinput> содержит набор допустимых символов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>StringDetect</term>
<listitem>
<para>Проверка на совпадение со строкой.</para>
<programlisting>&lt;StringDetect String=&quot;(string)&quot; [insensitive=&quot;true|false&quot;] (common attributes) (dynamic) /&gt;</programlisting>
<para>Параметр <userinput>String</userinput> должен содержать строку, которую нужно проверить на соответствие. Атрибут <userinput>insensitive</userinput> по умолчанию имеет значение <userinput>false</userinput>, он влияет на сравнение строк. Если этот параметр установлен <userinput>true</userinput>, функция сравнения не будет учитывать регистр символов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>RegExpr</term>
<listitem>
<para>Проверка на совпадение с регулярным выражением.</para>
<programlisting>&lt;RegExpr String=&quot;(string)&quot; [insensitive=&quot;true|false&quot;] [minimal=&quot;true|false&quot;] (common attributes) (dynamic) /&gt;</programlisting>
<para>Параметр <userinput>String</userinput> определяет регулярное выражение.</para>
<para><userinput>insensitive</userinput> имеет то же значение, что и в предыдущем правиле; по умолчанию установлен <userinput>false</userinput>.</para>
<para>Параметр <userinput>minimal</userinput> по умолчанию имеет значение <userinput>false</userinput> и передаётся функции обработки регулярных выражений.</para>
<para>Символ перевода каретки (<literal>^</literal>) в начале регулярного выражения говорит о том, что данное правило будет применяться только к тем цепочкам символов, которые начинаются с новой строки.</para>
<para>Более подробно регулярные выражения рассматриваются в разделе <link linkend="regular-expressions"><quote>Регулярные выражения</quote></link>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>keyword</term>
<listitem>
<para>Проверка на ключевое слово из указанного списка.</para>
<programlisting>&lt;keyword String=&quot;(list name)&quot; (common attributes) /&gt;</programlisting>
<para>В параметре <userinput>String</userinput> нужно указать название списка ключевых слов. Этот список должен существовать.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>Int</term>
<listitem>
<para>Проверка на целое число.</para>
<para><programlisting>&lt;Int (common attributes) (dynamic) /&gt;</programlisting></para>
<para>Это правило не имеет своих параметров. Дочерние правила обычно используются для определения комбинаций символов <userinput>L</userinput> и <userinput>U</userinput> после числа, которые конкретизируют тип целой константы в коде программы. Вообще, все правила могут быть использованы в качестве дочерних, хотя <acronym>DTD</acronym> разрешает использовать в качестве дочернего только правило <userinput>StringDetect</userinput>.</para>
<para>Пример проверки на целые числа, следующие за символом 'L'. <programlisting>&lt;Int attribute="Decimal" context="#stay" &gt;
&lt;StringDetect attribute="Decimal" context="#stay" String="L" insensitive="true"/&gt;
&lt;/Int&gt;
</programlisting></para>
</listitem>
</varlistentry>
<varlistentry>
<term>Float</term>
<listitem>
<para>Проверка на число с плавающей точкой.</para>
<para><programlisting>&lt;Float (common attributes) /&gt;</programlisting></para>
<para>У этого правила нет особых атрибутов. <userinput>AnyChar</userinput> можно использовать как дочернее, обычно оно используется для проверки комбинаций. Для примера смотрите правило <userinput>Int</userinput>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>HlCOct</term>
<listitem>
<para>Проверка на восьмеричное число (должно начинаться с нуля).</para>
<para><programlisting>&lt;HlCOct (common attributes) /&gt;</programlisting></para>
<para>У этого правила нет особых атрибутов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>HlCHex</term>
<listitem>
<para>Проверка на шестнадцатеричное число (должно начинаться с символов <quote>0x</quote>).</para>
<para><programlisting>&lt;HlCHex (common attributes) /&gt;</programlisting></para>
<para>У этого правила нет особых атрибутов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>HlCStringChar</term>
<listitem>
<para>Проверка на управляющий символ.</para>
<para><programlisting>&lt;HlCStringChar (common attributes) /&gt;</programlisting></para>
<para>У этого правила нет особых атрибутов.</para>
<para>Проверка на специальное представление символов, которое используется в языках программирования, например, <userinput>\n</userinput> (переход на новую строку) или <userinput>\t</userinput> (символ табуляции).</para>
<para>Следующие символы соответствуют правилу, если они вводятся после обратной черты (<literal>\</literal>): <userinput>abefnrtv&quot;'?\</userinput>. Также будут соответствовать шестнадцатеричные и восьмеричные числа, предварённые обратной чертой (например, <userinput>\xff</userinput> и <userinput>\033</userinput>).</para>
</listitem>
</varlistentry>
<varlistentry>
<term>HlCChar</term>
<listitem>
<para>Проверка на символ C.</para>
<para><programlisting>&lt;HlCChar (common attributes) /&gt;</programlisting></para>
<para>У этого правила нет особых атрибутов.</para>
<para>Правило находит символы C, заключенные в одинарные кавычки (например, <userinput>'c'</userinput>). Внутри одинарных кавычек может быть как одиночный символ, так и управляющая последовательность, более подробно ознакомиться с которыми можно в описании правила HlCStringChar.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>RangeDetect</term>
<listitem>
<para>Проверка на строку, имеющую заданные начальный и конечный символы.</para>
<programlisting>&lt;RangeDetect char=&quot;(character)&quot; char1=&quot;(character)&quot; (common attributes) /&gt;</programlisting>
<para><userinput>char</userinput> определяет символ, с которого начинается строка, а <userinput>char1</userinput> - которым она заканчивается.</para>
<para>Это правило может быть использовано для поиска небольших строк, заключенных в кавычки, но, поскольку при проверке правила система подсветки работает с одной строкой, данное правило не сможет определить строку, разбитую символами перевода.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>LineContinue</term>
<listitem>
<para>Проверка на символ перевода строки.</para>
<programlisting>&lt;LineContinue (common attributes) /&gt;</programlisting>
<para>У этого правила нет особых атрибутов.</para>
<para>Это правило может быть удобно для переключения контекста в конце строки, если последним знаком будет обратная черта (<userinput>'\'</userinput>). Это необходимо, например, в языках C/C++ для продолжения макросов и строк.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>IncludeRules</term>
<listitem>
<para>Включение правил из другого контекста или языка/файла.</para>
<programlisting>&lt;IncludeRules context=&quot;contextlink&quot; [includeAttrib=&quot;true|false&quot;] /&gt;</programlisting>
<para>Атрибут <userinput>context</userinput> определяет контекст, из которого берётся правило.</para>
<para>Если это простая строка, то включаются все правила из другого контекста, например: <programlisting>&lt;IncludeRules context=&quot;anotherContext&quot; /&gt;</programlisting></para>
<para>Если строка начинается с <userinput>##</userinput>, то система подсветки найдёт описание для другого языка с указанным названием, например: <programlisting>&lt;IncludeRules context=&quot;##C++&quot; /&gt;</programlisting></para>
<para>Если <userinput>includeAttrib</userinput> выставить <emphasis>true</emphasis>, атрибут назначения должен быть таким же, как атрибут источника. Это необходимо, например, при вводе комментариев, если текст, соответствующий включаемому контексту, имеет иную подсветку, чем основной контекст. </para>
</listitem>
</varlistentry>
<varlistentry>
<term>DetectSpaces</term>
<listitem>
<para>Поиск пробелов.</para>
<programlisting>&lt;DetectSpaces (common attributes) /&gt;</programlisting>
<para>У этого правила нет особых атрибутов.</para>
<para>Используйте это правило, если вы уверены, что в тексте есть несколько пробелов подряд, например в начале строк с отступом. Это правило поможет пропустить все пробелы разом, вместо проверки каждого из них по нескольким параметрам.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>DetectIdentifier</term>
<listitem>
<para>Поиск строк идентификаторов (таких как регулярные выражения: [a-zA-Z_][a-zA-Z0-9_]*).</para>
<programlisting>&lt;DetectIdentifier (common attributes) /&gt;</programlisting>
<para>У этого правила нет особых атрибутов.</para>
<para>Используйте это правило, чтобы пропустить все буквенные символы разом, вместо проверки каждого из них по нескольким параметрам.</para>
</listitem>
</varlistentry>
</variablelist>
</sect2>
<sect2>
<title>Подсказки &amp; Советы</title>
<itemizedlist>
<para>Усвоив принцип действия переключения контекста, вы без труда сможете написать своё определение подсветки. Подумайте о том, в какой ситуации какое правило следует применить. Регулярные выражения - мощное средство, но, по сравнению с другими правилами, очень медленное. Поэтому стоит воспользоваться следующими советами. </para>
<listitem>
<para>Проверяя на соответствие только пару символов, воспользуйтесь <userinput>Detect2Chars</userinput> вместо <userinput>StringDetect</userinput>. То же относится к <userinput>DetectChar</userinput>.</para>
</listitem>
<listitem>
<para>Регулярные выражения несложны в использовании, но очень часто можно найти более быстрый способ. Допустим, вы ищете символ <userinput>'#'</userinput>, это первый символ строки. Решение с регулярным выражением будет выглядеть примерно так: <programlisting>&lt;RegExpr attribute=&quot;Macro&quot; context=&quot;macro&quot; String=&quot;^\s*#&quot; /&gt;</programlisting>. Этой же цели можно достичь значительно быстрее: <programlisting>&lt;DetectChar attribute=&quot;Macro&quot; context=&quot;macro&quot; char=&quot;#&quot; firstNonSpace=&quot;true&quot; /&gt;</programlisting>. Для поиска регулярного выражения <userinput>'^#'</userinput> можно применить <userinput>DetectChar</userinput> с атрибутом <userinput>column=&quot;0&quot;</userinput>. Отсчет для атрибута <userinput>column</userinput> идет посимвольно, поэтому знак табуляции для него - всего один символ. </para>
</listitem>
<listitem>
<para>Можно переключать контексты без специальных символов. Допустим, вы хотите переключить контекст при достижении строки <userinput>*/</userinput>, но в новом контексте хотите продолжить обработку этой строки. Можно воспользоваться нижеследующим правилом, а атрибут <userinput>lookAhead</userinput> заставит систему подсветки сохранить найденную строку для нового контекста. <programlisting>&lt;Detect2Chars attribute=&quot;Comment&quot; context=&quot;#pop&quot; char=&quot;*&quot; char1=&quot;/&quot; lookAhead=&quot;true&quot; /&gt;</programlisting>
</para>
</listitem>
<listitem>
<para>Если известно, что в тексте много пробелов, воспользуйтесь <userinput>DetectSpaces</userinput>.</para>
</listitem>
<listitem>
<para>Пользуйтесь <userinput>DetectIdentifier</userinput> вместо регулярного выражения <userinput>'[a-zA-Z_]\w*'</userinput>.</para>
</listitem>
<listitem>
<para>Старайтесь использовать стандартные стили, это удобно для пользователя.</para>
</listitem>
<listitem>
<para>Заглянув в другие XML-файлы, вы узнаете много нового о работе с правилами.</para>
</listitem>
<listitem>
<para>Проверить правильность XML-файла можно командой <command>xmllint --dtdvalid language.dtd mySyntax.xml</command>.</para>
</listitem>
<listitem>
<para>Если сложное регулярное выражение встречается часто, воспользуйтесь <emphasis>ENTITIES</emphasis>. Пример:</para>
<programlisting>&lt;?xml version="1.0" encoding="UTF-8"?&gt;
&lt;!DOCTYPE language SYSTEM "language.dtd"
[
&lt;!ENTITY myref "[A-Za-z_:][\w.:_-]*"&gt;
]&gt;
</programlisting>
<para>Теперь вместо регулярного выражения можно использовать <emphasis>&amp;myref;</emphasis>.</para>
</listitem>
</itemizedlist>
</sect2>
</sect1>
</appendix>