You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
tde-i18n/tde-i18n-ru/docs/tdebase/kate/highlighting.docbook

1405 lines
59 KiB

<appendix id="highlight">
<appendixinfo>
<authorgroup>
<author
><personname
><firstname
></firstname
></personname
></author>
<othercredit role="translator"
><firstname
>Андрей</firstname
><surname
>Балагута</surname
><affiliation
><address
><email
>uj2@mail.ru</email
></address
></affiliation
><contrib
>Перевод на русский</contrib
></othercredit
><othercredit role="translator"
><firstname
>Алексей</firstname
><surname
>Опарин</surname
><affiliation
><address
><email
>opaleksej@yandex.ru</email
></address
></affiliation
><contrib
>Перевод на русский</contrib
></othercredit
>
</authorgroup>
</appendixinfo>
<title
>Подсветка синтаксиса</title>
<sect1 id="highlight-overview">
<title
>Обзор</title>
<para
>Синтаксическая подсветка позволяет отображать текст в редакторе разными цветами и стилями, таким образом отделяя одни синтаксические понятия от других. Например, в исходном тексте программы можно ключевые слова выделить полужирным шрифтом, а типы данных и комментарии отображать разными цветами, выделяя их из основного текста. Это улучшает читаемость документа и повышает продуктивность работы автора.</para>
<mediaobject>
<imageobject
><imagedata format="PNG" fileref="highlighted.png"/></imageobject>
<textobject
><phrase
>Функция Perl, отображенная с использованием синтаксической подсветки.</phrase
></textobject>
<caption
><para
>Функция Perl, отображенная с использованием синтаксической подсветки.</para>
</caption>
</mediaobject>
<mediaobject>
<imageobject
><imagedata format="PNG" fileref="unhighlighted.png"/></imageobject>
<textobject
><phrase
>Та же самая функция, но без подсветки.</phrase
></textobject>
<caption
><para
>Та же самая функция, но без подсветки.</para
></caption>
</mediaobject>
<para
>Какой из примеров легче читать?</para>
<para
>&kate; имеет гибкую, легко настраиваемую систему синтаксической подсветки, в стандартную поставку редактора входят правила подсветки синтаксиса для большого числа языков программирования, разметки и других текстовых форматов. Все определения хранятся в простых текстовых файлах в формате &XML;, поэтому вы можете свободно создавать собственные правила.</para>
<para
>При открытии файла &kate; автоматически подбирает правила подсветки, основываясь на &MIME;-типе (который, в свою очередь, определяется расширением файла) или содержании файла, если расширения нет. Если &kate; неправильно определил тип файла, выберите нужный режим подсветки вручную в меню <menuchoice
><guimenu
>Документ</guimenu
><guisubmenu
>Режим подсветки</guisubmenu
></menuchoice
>.</para>
<para
>Вы можете настроить стили и цвета доступных синтаксических определений на вкладке <link linkend="config-dialog-editor-appearance"
>Схемы</link
>диалога <link linkend="config-dialog"
>Настройка &kate;</link
> , а соответствующие им &MIME;-типы - на вкладке <link linkend="config-dialog-editor-highlighting"
>Подсветка</link
> .</para>
<note>
<para
>Синтаксическая подсветка улучшает читаемость корректно оформленного текста, но не факт, что текст некорректен, если он неправильно отображается системой подсветки. Синтаксическая разметка текста - достаточно сложный процесс, сложность которого зависит от формата файла, поэтому авторы синтаксических определений считают удачей, если 98% текста отображается корректно, но не стоит забывать об оставшихся 2%.</para>
</note>
<tip>
<para
>На сайте &kate; вы можете загрузить обновлённые или дополнительные правила синтаксической подсветки. Для этого нужно щёлкнуть на кнопке <guibutton
>Загрузить</guibutton
> на вкладке <link linkend="config-dialog-editor-highlighting"
>Подсветка</link
> диалога <link linkend="config-dialog"
>Настройка &kate;</link
>.</para>
</tip>
</sect1>
<sect1 id="katehighlight-system">
<title
>Система синтаксической подсветки &kate;</title>
<para
>В этом разделе подробно рассматривается механизм синтаксической подсветки &kate;. Прочитав его, вы сможете изменять существующие или создавать свои синтаксические определения.</para>
<sect2 id="katehighlight-howitworks">
<title
>Механизм работы</title>
<para
>Когда вы открываете файл, первое, что делает &kate; - определяет, какое синтаксическое определение использовать для него. При чтении и наборе система подсветки анализирует текст в редакторе, используя правила, указанные в синтаксическом определении, и помечает границы контекстов и стилей.</para>
<para
>При вводе система динамически анализирует текст, поэтому, если вы удалите символ, который был помечен как начало или конец контекста, стиль окружающего текста автоматически изменится.</para>
<para
>Синтаксические определения &kate; хранятся в &XML;-файлах. Они содержат: <itemizedlist>
<listitem
><para
>Правила определения роли текста, организованного в контекстные блоки</para
></listitem>
<listitem
><para
>Списки ключевых слов</para
></listitem>
<listitem
><para
>Определения стилей</para
></listitem>
</itemizedlist>
</para>
<para
>Система подсветки анализирует текст последовательно от начала до конца. Указатель анализатора перемещается от символа к символу, проверяя текст на соответствие правилам и помечая границы контекстов. Правила применяются к текущей строке в порядке их объявления, и при соответствии к ней применяется контекст, указанный в правиле. После этого указатель смещается на конец области соответствия и начинается новый цикл проверки правил, принадлежащих установленному контексту.</para>
</sect2>
<sect2 id="highlight-system-rules">
<title
>Правила</title>
<para
>Правила - это сердце системы подсветки. Правило может быть строкой, символом или <link linkend="regular-expressions"
>регулярным выражением</link
>, с которым сравнивается текст документа. Оно содержит информацию о стиле, который будет применен к тексту, если последний соответствует правилу. Оно может переключить текущий контекст системы на явно указанный или предыдущий контекст.</para>
<para
>Правила организованы в контекстные группы. Контекстная группа используется для определения главных понятий в формате, например, строка, заключенная в двойные кавычки, или блок комментария в исходном тексте программы. Такая организация правил позволяет предотвратить проверку правил, неприменимых к текущему контексту (правил из других контекстов). Эта структура делает систему подсветки более гибкой, позволяя определять одинаковые правила в разных контекстах, что делает возможным одинаковые последовательности символов отображать разными стилями в зависимости от контекста, в котором они находятся. </para>
<para
>Контексты могут образовываться динамически, чтобы сделать возможным использование правил, справедливых для данного момента.</para>
</sect2>
<sect2 id="highlight-context-styles-keywords">
<title
>Стили контекстов и ключевые слова</title>
<para
>В некоторых языках программирования целые и вещественные числа трактуются компилятором по-разному (компилятор - это программа, которая преобразует исходный текст программы в двоичный исполняемый файл). Синтаксис языка может определять символы, имеющие специальное значение, если они находятся в строке, заключенной в кавычки. В этих случаях есть смысл выделять их в тексте для более удобного чтения. Иногда бывает полезно выделять символы, не имеющие специального значения - это тоже под силу системе синтаксической подсветки &kate;.</para>
<para
>Синтаксическое определение может содержать столько стилей, сколько нужно для данного формата.</para>
<para
>Во многих форматах существуют списки слов, имеющих специальное значение. Например, в языках программирования такими словами будут являться управляющие операторы, названия типов данных и встроенные функции. Это концептуальные слова, поскольку они определяют саму суть синтаксиса. Система синтаксической подсветки &kate; использует списки подобных слов, чтобы подчеркнуть концептуальные элементы формата.</para>
</sect2>
<sect2 id="kate-highlight-system-default-styles">
<title
>Стили по умолчанию</title>
<para
>Если вы откроете файл исходного кода на C++, на &Java; или документ <acronym
>HTML</acronym
>, то увидите, что разные форматы отображаются в одних и тех же цветах. Дело в том, что &kate; содержит предустановленный набор стандартных стилей. Синтаксические определения по возможности используют этот набор.</para>
<para
>Это позволяет подобным образом отображать похожие концепции в различных форматах. Например, комментарии есть почти во всех языках программирования, разметки и скриптах.</para>
<tip>
<para
>Каждый стиль в синтаксическом определении основывается на одном из стандартных стилей. Поэтому, если вы часто используете какой-то формат с большим количеством стилей, следует проверить его конфигурацию на предмет их совпадения. Приведём небольшой пример. В &kate; определен всего один стандартный стиль для отображения строковых констант, но в языке программирования Perl существует два вида строк. Согласитесь, было бы гораздо лучше отображать их по разному - вы заходите в диалоговое окно настройки &kate; и изменяете соответствующие стили. Все <link linkend="kate-highlight-default-styles"
>доступные стандартные стили</link
> будут рассмотрены позже.</para>
</tip>
</sect2>
</sect1>
<sect1 id="katehighlight-xml-format">
<title
>&XML;-формат определения синтаксической подсветки</title>
<sect2>
<title
>Обзор</title>
<para
>В этом разделе вы познакомитесь с &XML;-форматом определения синтаксической подсветки. Вначале, на небольшом примере, будут кратко объяснены главные компоненты и их значение, затем мы более подробно остановимся на правилах подсветки.</para>
<para
>Формальное определение (<acronym
>DTD</acronym
>) находится в файле <filename
>language.dtd</filename
>, в каталоге <filename
>$<envar
>TDEDIR</envar
>/share/apps/katepart/syntax</filename
>. </para>
<variablelist>
<title
>Основные разделы файла определения синтаксической подсветки &kate;</title>
<varlistentry>
<term
>В заголовке файла подсветки указаны версия XML и тип документа:</term>
<listitem>
<programlisting
>&lt;?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?&gt;
&lt;!DOCTYPE language SYSTEM &quot;language.dtd&quot;&gt;
</programlisting>
</listitem>
</varlistentry>
<varlistentry>
<term
>Главная часть файла определений - элемент <userinput
>language</userinput
>. Доступные атрибуты:</term>
<listitem>
<para
>Необходимые атрибуты:</para>
<para
><userinput
>name</userinput
> определяет название языка. Впоследствии оно появляется во всех меню и диалогах.</para>
<para
><userinput
>section</userinput
> указывает категорию.</para>
<para
><userinput
>extensions</userinput
> определяет расширения файлов, вроде &quot;*.cpp;*.h&quot;</para>
<para
>Дополнительные атрибуты:</para>
<para
><userinput
>mimetype</userinput
> связывает файл с определенным типом &MIME;.</para>
<para
><userinput
>version</userinput
> указывает текущую версию файла определений.</para>
<para
><userinput
>kateversion</userinput
> указывает новейшую из поддерживаемых версий &kate;.</para>
<para
><userinput
>casesensitive</userinput
> определяет чувствительность ключевых слов к регистру.</para>
<para
><userinput
>priority</userinput
> определяет приоритет в случае использования разных правил подсветки. Действует правило с высшим приоритетом.</para>
<para
><userinput
>author</userinput
> содержит имя и email-адрес автора.</para>
<para
><userinput
>license</userinput
> содержит лицензию, обычно LGPL, Artistic, GPL и т.п.</para>
<para
><userinput
>hidden</userinput
> определяет, будет ли отображаться название в меню &kate;.</para>
<para
>Итак, следующая строка может быть примерно такой:</para>
<programlisting
>&lt;language name=&quot;C++&quot; version=&quot;1.00&quot; kateversion=&quot;2.4&quot; section=&quot;Sources&quot; extensions=&quot;*.cpp;*.h&quot; /&gt;
</programlisting>
</listitem>
</varlistentry>
<varlistentry>
<term
>Следующий элемент - <userinput
>highlighting</userinput
>, состоящий из необязательного <userinput
>list</userinput
> и обязательных - <userinput
>contexts</userinput
> и <userinput
>itemDatas</userinput
>.</term>
<listitem>
<para
>Элемент <userinput
>list</userinput
> содержит список ключевых слов. В нашем случае это <emphasis
>class</emphasis
> и <emphasis
>const</emphasis
>.Списков можете добавить, сколько хотите.</para>
<para
>Элемент <userinput
>contexts</userinput
> содержит все контексты. По умолчанию, подсветка начинается с первого контекста. В контексте <emphasis
>Normal Text</emphasis
> есть два правила, одно из которых проверяет наличие в тексте <emphasis
>слов</emphasis
>, соответствующих списку ключевых слов, другое определяет наличие кавычек и переключает контекст к <emphasis
>строковому</emphasis
> типу. Подробнее правила описаны в следующей главе.</para>
<para
>Элемент <userinput
>itemDatas</userinput
> содержит сведения о цветах и стилях, применяющихся в контекстах и правилах. В нашем примере <userinput
>itemData</userinput
> использует контексты <emphasis
>Normal Text</emphasis
>, <emphasis
>String</emphasis
> и <emphasis
>Keyword</emphasis
>. </para>
<programlisting
>&lt;highlighting&gt;
&lt;list name=&quot;somename&quot;&gt;
&lt;item&gt; class &lt;/item&gt;
&lt;item&gt; const &lt;/item&gt;
&lt;/list&gt;
&lt;contexts&gt;
&lt;context attribute=&quot;Normal Text&quot; lineEndContext=&quot;#pop&quot; name=&quot;Normal Text&quot; &gt;
&lt;keyword attribute=&quot;Keyword&quot; context=&quot;#stay&quot; String=&quot;somename&quot; /&gt;
&lt;DetectChar attribute=&quot;String&quot; context=&quot;string&quot; char=&quot;&amp;quot;&quot; /&gt;
&lt;/context&gt;
&lt;context attribute=&quot;String&quot; lineEndContext=&quot;#stay&quot; name=&quot;string&quot; &gt;
&lt;DetectChar attribute=&quot;String&quot; context=&quot;#pop&quot; char=&quot;&amp;quot;&quot; /&gt;
&lt;/context&gt;
&lt;/contexts&gt;
&lt;itemDatas&gt;
&lt;itemData name=&quot;Normal Text&quot; defStyleNum=&quot;dsNormal&quot; /&gt;
&lt;itemData name=&quot;Keyword&quot; defStyleNum=&quot;dsKeyword&quot; /&gt;
&lt;itemData name=&quot;String&quot; defStyleNum=&quot;dsString&quot; /&gt;
&lt;/itemDatas&gt;
&lt;/highlighting&gt;
</programlisting>
</listitem>
</varlistentry>
<varlistentry>
<term
> Последня часть файла определения синтаксической подсветки - необязательный раздел <userinput
>general</userinput
>. Здесь могут содержаться сведения о ключевых словах, сворачивании блоков кода, комментариях и отступах.</term>
<listitem>
<para
>Раздел <userinput
>comment</userinput
> определяет, какой строкой вводится однострочный комментарий. Можно пользоваться также многострочными комментариями, используя <emphasis
>multiLine</emphasis
> с дополнительным атрибутом <emphasis
>end</emphasis
>. Это используется тогда, когда пользователь нажимает комбинацию клавиш, назначенную для действия <emphasis
>закомментировать/раскомментировать</emphasis
>.</para>
<para
>Секция <userinput
>keywords</userinput
> определяет чувствительность ключевых слов к регистру. Остальные атрибуты рассмотрим позднее.</para>
<programlisting
>&lt;general&gt;
&lt;comments&gt;
&lt;comment name="singleLine" start="#"/&gt;
&lt;/comments&gt;
&lt;keywords casesensitive="1"/&gt;
&lt;/general&gt;
&lt;/language&gt;
</programlisting>
</listitem>
</varlistentry>
</variablelist>
</sect2>
<sect2 id="kate-highlight-sections">
<title
>Более подробно о разделах</title>
<para
>В этой части указаны все возможные атрибуты для контекстов, itemDatas, ключевых слов, комментариев, сворачивания кодов и отступов.</para>
<variablelist>
<varlistentry>
<term
>Элемент <userinput
>context</userinput
> относится к группе <userinput
>contexts</userinput
>. Контекстом определяются некоторые особые правила (например, что происходит при достижении подсвеченной структурой конца строки). Доступные атрибуты:</term>
<listitem>
<para
><userinput
>name</userinput
> - название контекста. Правила используют это название для переключения на указанный контекст.</para>
<para
><userinput
>lineEndContext</userinput
> определяет, на какой контекст подсвеченная структура переключается при достижении конца строки. Это может быть название другого контекста, <userinput
>#stay</userinput
>, если контекст не меняется (т.е. не делать ничего) или <userinput
>#pop</userinput
> для выхода из контекста. Например, набор <userinput
>#pop#pop#pop</userinput
> приведет к троекратному выходу из контекста.</para>
<para
><userinput
>lineBeginContext</userinput
> определяет контекст при достижении начала строки. По умолчанию: #stay.</para>
<para
><userinput
>fallthrough</userinput
> определяет поведение в случае переключения подсвеченной структуры на контекст, указанный в fallthroughContext, если не найдено соответствующее правило. По умолчанию: <emphasis
>false</emphasis
>.</para>
<para
><userinput
>fallthroughContext</userinput
> указывает следующий контекст, если не найдено соответствующее правило.</para>
<para
>Если <userinput
>dynamic</userinput
> имеет значение <emphasis
>true</emphasis
>, то контекст запоминает строки/метки-заполнители, сохранённые в динамических правилах. Это необходимо, например, для текущих документов. По умолчанию: <emphasis
>false</emphasis
>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Элемент <userinput
>itemData</userinput
> принадлежит группе <userinput
>itemDatas</userinput
>. Он определяет стиль и цвет шрифта, их можно устанавливать самому в тех случаях, когда это необходимо. И все же, рекомендуется придерживаться стандартных стилей, чтобы помочь пользователю свободно ориентироваться в любом языке . Название атрибута (name) и defStyleNum обязательны, остальные нет. Доступные атрибуты:</term>
<listitem>
<para
><userinput
>name</userinput
> даёт название itemData. Контексты и правила будут использовать это название при обращении к itemData в своих атрибутах <emphasis
>attribute</emphasis
>.</para>
<para
><userinput
>defStyleNum</userinput
> определяет стиль, используемый по умолчанию. Доступные стандартные стили будут детально описаны ниже.</para>
<para
><userinput
>color</userinput
> определяет цвет. Правильные форматы '#rrggbb' или '#rgb'.</para>
<para
><userinput
>selColor</userinput
> определяет цвет выделенного текста.</para>
<para
>Если <userinput
>italic</userinput
> имеет значение <emphasis
>true</emphasis
>, шрифт будет курсивным.</para>
<para
>Если <userinput
>bold</userinput
> имеет значение <emphasis
>true</emphasis
>, шрифт будет полужирным.</para>
<para
>Если <userinput
>underline</userinput
> имеет значение <emphasis
>true</emphasis
>, текст будет подчёркнут.</para>
<para
>Если <userinput
>strikeout</userinput
> имеет значение <emphasis
>true</emphasis
>, текст будет зачёркнут.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Элемент <userinput
>keywords</userinput
> в группе <userinput
>general</userinput
> определяет свойства ключевых слов. Доступные атрибуты:</term>
<listitem>
<para
><userinput
>casesensitive</userinput
> может быть <emphasis
>true</emphasis
> или <emphasis
>false</emphasis
>. Если <emphasis
>true</emphasis
>, все ключевые слова будут проверяться на соответствие с учетом регистра</para>
<para
><userinput
>weakDeliminator</userinput
> - это группа знаков, которые не могут разделять слова. Например, точка <userinput
>'.'</userinput
> - разделитель слов. Если ключевое слово в <userinput
>list</userinput
> содержит точку, оно будет использовано по назначению только, если точка будет определена как "нетвердый разделитель" (weak delimiter).</para>
<para
><userinput
>additionalDeliminator</userinput
> определяют дополнительные разделители.</para>
<para
><userinput
>wordWrapDeliminator</userinput
> определяют символы, после которых может происходить перевод строки.</para>
<para
>По умолчанию разделителями слов и строк являются символы <userinput
>.():!+,-&lt;=&gt;%&amp;*/;?[]^{|}~\</userinput
>, пробел (<userinput
>' '</userinput
>) и табуляция (<userinput
>'\t'</userinput
>).</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Элемент <userinput
>comment</userinput
> в группе <userinput
>comments</userinput
> определяет свойства комментариев, которые используются в меню<menuchoice
><guimenu
>Сервис</guimenu
><guimenuitem
>Закомментировать</guimenuitem
></menuchoice
> и <menuchoice
><guimenu
>Сервис</guimenu
><guimenuitem
>Раскомментировать</guimenuitem
></menuchoice
>. Доступные атрибуты:</term>
<listitem>
<para
><userinput
>name</userinput
> может быть <emphasis
>singleLine</emphasis
> или <emphasis
>multiLine</emphasis
>. Если выбрать <emphasis
>multiLine</emphasis
>, то потребуются атрибуты <emphasis
>end</emphasis
> и <emphasis
>region</emphasis
>.</para>
<para
><userinput
>start</userinput
> указывает строку начала комментария. В C++ это может быть &quot;/*&quot;.</para>
<para
><userinput
>end</userinput
> указывает строку окончания комментария. В C++ это может быть &quot;*/&quot;.</para>
<para
><userinput
>region</userinput
> должно быть названием сворачиваемого многострочного комментария. Допустим, если в ваших правилах указано <emphasis
>beginRegion="Comment"</emphasis
> ... <emphasis
>endRegion="Comment"</emphasis
>, вы должны использовать <emphasis
>region="Comment"</emphasis
>. В этом случае раскомментирование будет действовать, даже если не будет выделен весь текст многострочного комментария. Достаточно будет просто поместить курсор в его пределы.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Элемент <userinput
>folding</userinput
> в группе <userinput
>general</userinput
> определяет свойства сворачивания кода. Доступные атрибуты:</term>
<listitem>
<para
>Если <userinput
>indentationsensitive</userinput
> имеет значение <emphasis
>true</emphasis
>, то маркёры сворачивания кода будут располагаться с учетом отступов, как в языке сценариев Python. Чаще всего в этом нет необходимости, поэтому по умолчанию этот параметр определен как <emphasis
>false</emphasis
>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Элемент <userinput
>indentation</userinput
> в группе <userinput
>general</userinput
> определяет формат отступов, однако мы настоятельно рекомендуем не менять этот элемент, так как отступы обычно определяются типом файла или добавлением режимной строки в текстовый файл. Если вы всё-таки укажете способ отступа, он может оказаться навязанным пользователю, которому совсем не нужен. Доступные атрибуты:</term>
<listitem>
<para
><userinput
>mode</userinput
> - название формата отступов. Доступные форматы: <emphasis
>normal, cstyle, csands, xml, python</emphasis
> и <emphasis
>varindent</emphasis
>.</para>
</listitem>
</varlistentry>
</variablelist>
</sect2>
<sect2 id="kate-highlight-default-styles">
<title
>Стандартные стили</title>
<para
>Стандартные стили уже были кратко <link linkend="kate-highlight-system-default-styles"
>описаны</link
>: Стандартные стили предопределяют настройки цветов и шрифтов.</para>
<variablelist>
<varlistentry>
<term
>Здесь приведен только список доступных стандартных стилей:</term>
<listitem>
<para
><userinput
>dsNormal</userinput
>, для нормального текста.</para>
<para
><userinput
>dsKeyword</userinput
>, для ключевых слов.</para>
<para
><userinput
>dsDataType</userinput
>, для типов данных.</para>
<para
><userinput
>dsDecVal</userinput
>, для десятичных значений.</para>
<para
><userinput
>dsBaseN</userinput
>, для значений с основанием, отличным от10.</para>
<para
><userinput
>dsFloat</userinput
>, для значений с плавающей точкой.</para>
<para
><userinput
>dsChar</userinput
>, для символов.</para>
<para
><userinput
>dsString</userinput
>, для строк.</para>
<para
><userinput
>dsComment</userinput
>, для комментариев.</para>
<para
><userinput
>dsOthers</userinput
>, для всего остального.</para>
<para
><userinput
>dsAlert</userinput
>, для вывода предупреждений.</para>
<para
><userinput
>dsFunction</userinput
>, для вызова функций.</para>
<para
><userinput
>dsRegionMarker</userinput
>, для маркёров участков.</para>
<para
><userinput
>dsError</userinput
>, для подсветки ошибок и неверного синтаксиса.</para>
</listitem>
</varlistentry>
</variablelist>
</sect2>
</sect1>
<sect1 id="kate-highlight-rules-detailled">
<title
>Синтаксические правила</title>
<para
>В этом разделе описываются синтаксические правила.</para>
<para
>При анализе строки каждое правило может <quote
>запросить</quote
> на проверку любое количество символов (даже ноль). Если правило подходит, к соответствующим символам применяется стиль или <emphasis
>атрибут</emphasis
>, определённый в правиле. Применяемое правило также может запросить переключение текущего контекста.</para>
<para
>Правило выглядит примерно так:</para>
<programlisting
>&lt;RuleName attribute=&quot;(identifier)&quot; context=&quot;(identifier)&quot; [rule specific attributes] /&gt;</programlisting>
<para
>Параметр <emphasis
>attribute</emphasis
> указывает, какой стиль применить к символам, соответствующим правилу. Параметр <emphasis
>context</emphasis
> определяет контекст, который будет установлен в случае применения правила.</para>
<para
>Параметр <emphasis
>context</emphasis
> может принимать следующие значения:</para>
<itemizedlist>
<listitem>
<para
><emphasis
>Идентификатор</emphasis
>, т.е. название контекста.</para>
</listitem>
<listitem>
<para
><emphasis
>order</emphasis
> предписывает системе подсветки не менять текущий контекст (<userinput
>#stay</userinput
>) или вернуться к предыдущему контексту (<userinput
>#pop</userinput
>).</para>
<para
>Чтобы вернуться назад на несколько контекстов, повторите нужное количество раз ключевое слово #pop: <userinput
>#pop#pop#pop</userinput
></para>
</listitem>
</itemizedlist>
<para
>Некоторые правила могут иметь <emphasis
>дочерние правила</emphasis
>, которые проверяются только в том случае, если текст соответствует родительскому правилу. Всей совпавшей строке будут присвоены атрибуты, определенные в родительском правиле. Вот пример правила с дочерними правилами:</para>
<programlisting
>&lt;RuleName (attributes)&gt;
&lt;ChildRuleName (attributes) /&gt;
...
&lt;/RuleName&gt;
</programlisting>
<para
>Параметры конкретных видов правил описаны в следующих разделах.</para>
<itemizedlist>
<title
>Общие атрибуты</title>
<para
>У любого правила есть следующие атрибуты, <userinput
>(common attributes)</userinput
>, доступные всегда. <emphasis
>attribute</emphasis
> и <emphasis
>context</emphasis
> обязательны, остальные - нет. </para>
<listitem>
<para
><emphasis
>attribute</emphasis
>: Атрибут, описывающий определённые <emphasis
>itemData</emphasis
>.</para>
</listitem>
<listitem>
<para
><emphasis
>context</emphasis
>: Определяет контекст, на который происходит переключение в случае соответствия правилу.</para>
</listitem>
<listitem>
<para
><emphasis
>beginRegion</emphasis
>: Начало сворачиваемого блока кода. По умолчанию: не установлен (unset).</para>
</listitem>
<listitem>
<para
><emphasis
>endRegion</emphasis
>: Окончание сворачиваемого блока кода. По умолчанию: не установлен (unset).</para>
</listitem>
<listitem>
<para
>Если <emphasis
>lookAhead</emphasis
> имеет значение <emphasis
>true</emphasis
>, то система подсветки больше не будет обрабатывать соответствия. По умолчанию: <emphasis
>false</emphasis
>.</para>
</listitem>
<listitem>
<para
><emphasis
>firstNonSpace</emphasis
>: Соответствие, только если строка начинается не с пробела. По умолчанию: <emphasis
>false</emphasis
>.</para>
</listitem>
<listitem>
<para
><emphasis
>column</emphasis
>: Соответствие, только если соответствует номер столбца. По умолчанию: не установлено (unset).</para>
</listitem>
</itemizedlist>
<itemizedlist>
<title
>Динамические правила</title>
<para
>У некоторых правил есть необязательный атрибут <userinput
>dynamic</userinput
>, имеющий логическое значение (по умолчанию <emphasis
>false</emphasis
>). Если dynamic установить <emphasis
>true</emphasis
>, то правило может использовать метки-заполнители, заменяющие текст, соответствующий правилу <emphasis
>регулярного выражения</emphasis
>, переключенного к текущему контексту по своим атрибутам <userinput
>string</userinput
> или <userinput
>char</userinput
>. В атрибуте <userinput
>string</userinput
> метка-заполнитель <replaceable
>%N</replaceable
> (где N - цифра) будет заменена номером <replaceable
>N</replaceable
> найденного регулярного выражения. В атрибуте <userinput
>char</userinput
> метка-заполнитель должна быть цифрой <replaceable
>N</replaceable
>, и будет заменена первым символом <replaceable
>N</replaceable
> найденного регулярного выражения. Чтобы правило могло использовать эти атрибуты, оно должно содержать параметр <emphasis
>(dynamic)</emphasis
>.</para>
<listitem>
<para
><emphasis
>dynamic</emphasis
>: логический атрибут <emphasis
>(true|false)</emphasis
>.</para>
</listitem>
</itemizedlist>
<sect2 id="highlighting-rules-in-detail">
<title
>Более подробно о правилах</title>
<variablelist>
<varlistentry>
<term
>DetectChar</term>
<listitem>
<para
>Проверка на совпадение с одним определенным символом. Используется, например, для определения завершающего символа строки, заключённой в кавычки.</para>
<programlisting
>&lt;DetectChar char=&quot;(character)&quot; (common attributes) (dynamic) /&gt;</programlisting>
<para
>Параметр <userinput
>char</userinput
> определяет символ.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Detect2Chars</term>
<listitem>
<para
>Проверка на совпадение с двумя символами в заданном порядке.</para>
<programlisting
>&lt;Detect2Chars char=&quot;(character)&quot; char1=&quot;(character)&quot; (common attributes) (dynamic) /&gt;</programlisting>
<para
>Параметр <userinput
>char</userinput
> определяет первый символ для проверки, <userinput
>char1</userinput
> - второй.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>AnyChar</term>
<listitem>
<para
>Проверка на совпадение с любым символом из заданного набора.</para>
<programlisting
>&lt;AnyChar String=&quot;(string)&quot; (common attributes) /&gt;</programlisting>
<para
>Параметр <userinput
>String</userinput
> содержит набор допустимых символов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>StringDetect</term>
<listitem>
<para
>Проверка на совпадение со строкой.</para>
<programlisting
>&lt;StringDetect String=&quot;(string)&quot; [insensitive=&quot;true|false&quot;] (common attributes) (dynamic) /&gt;</programlisting>
<para
>Параметр <userinput
>String</userinput
> должен содержать строку, которую нужно проверить на соответствие. Атрибут <userinput
>insensitive</userinput
> по умолчанию имеет значение <userinput
>false</userinput
>, он влияет на сравнение строк. Если этот параметр установлен <userinput
>true</userinput
>, функция сравнения не будет учитывать регистр символов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>RegExpr</term>
<listitem>
<para
>Проверка на совпадение с регулярным выражением.</para>
<programlisting
>&lt;RegExpr String=&quot;(string)&quot; [insensitive=&quot;true|false&quot;] [minimal=&quot;true|false&quot;] (common attributes) (dynamic) /&gt;</programlisting>
<para
>Параметр <userinput
>String</userinput
> определяет регулярное выражение.</para>
<para
><userinput
>insensitive</userinput
> имеет то же значение, что и в предыдущем правиле; по умолчанию установлен <userinput
>false</userinput
>.</para>
<para
>Параметр <userinput
>minimal</userinput
> по умолчанию имеет значение <userinput
>false</userinput
> и передаётся функции обработки регулярных выражений.</para>
<para
>Символ перевода каретки (<literal
>^</literal
>) в начале регулярного выражения говорит о том, что данное правило будет применяться только к тем цепочкам символов, которые начинаются с новой строки.</para>
<para
>Более подробно регулярные выражения рассматриваются в разделе <link linkend="regular-expressions"
><quote
>Регулярные выражения</quote
></link
>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>keyword</term>
<listitem>
<para
>Проверка на ключевое слово из указанного списка.</para>
<programlisting
>&lt;keyword String=&quot;(list name)&quot; (common attributes) /&gt;</programlisting>
<para
>В параметре <userinput
>String</userinput
> нужно указать название списка ключевых слов. Этот список должен существовать.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Int</term>
<listitem>
<para
>Проверка на целое число.</para>
<para
><programlisting
>&lt;Int (common attributes) (dynamic) /&gt;</programlisting
></para>
<para
>Это правило не имеет своих параметров. Дочерние правила обычно используются для определения комбинаций символов <userinput
>L</userinput
> и <userinput
>U</userinput
> после числа, которые конкретизируют тип целой константы в коде программы. Вообще, все правила могут быть использованы в качестве дочерних, хотя <acronym
>DTD</acronym
> разрешает использовать в качестве дочернего только правило <userinput
>StringDetect</userinput
>.</para>
<para
>Пример проверки на целые числа, следующие за символом 'L'. <programlisting
>&lt;Int attribute="Decimal" context="#stay" &gt;
&lt;StringDetect attribute="Decimal" context="#stay" String="L" insensitive="true"/&gt;
&lt;/Int&gt;
</programlisting
></para>
</listitem>
</varlistentry>
<varlistentry>
<term
>Float</term>
<listitem>
<para
>Проверка на число с плавающей точкой.</para>
<para
><programlisting
>&lt;Float (common attributes) /&gt;</programlisting
></para>
<para
>У этого правила нет особых атрибутов. <userinput
>AnyChar</userinput
> можно использовать как дочернее, обычно оно используется для проверки комбинаций. Для примера смотрите правило <userinput
>Int</userinput
>.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>HlCOct</term>
<listitem>
<para
>Проверка на восьмеричное число (должно начинаться с нуля).</para>
<para
><programlisting
>&lt;HlCOct (common attributes) /&gt;</programlisting
></para>
<para
>У этого правила нет особых атрибутов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>HlCHex</term>
<listitem>
<para
>Проверка на шестнадцатеричное число (должно начинаться с символов <quote
>0x</quote
>).</para>
<para
><programlisting
>&lt;HlCHex (common attributes) /&gt;</programlisting
></para>
<para
>У этого правила нет особых атрибутов.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>HlCStringChar</term>
<listitem>
<para
>Проверка на управляющий символ.</para>
<para
><programlisting
>&lt;HlCStringChar (common attributes) /&gt;</programlisting
></para>
<para
>У этого правила нет особых атрибутов.</para>
<para
>Проверка на специальное представление символов, которое используется в языках программирования, например, <userinput
>\n</userinput
> (переход на новую строку) или <userinput
>\t</userinput
> (символ табуляции).</para>
<para
>Следующие символы соответствуют правилу, если они вводятся после обратной черты (<literal
>\</literal
>): <userinput
>abefnrtv&quot;'?\</userinput
>. Также будут соответствовать шестнадцатеричные и восьмеричные числа, предварённые обратной чертой (например, <userinput
>\xff</userinput
> и <userinput
>\033</userinput
>).</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>HlCChar</term>
<listitem>
<para
>Проверка на символ C.</para>
<para
><programlisting
>&lt;HlCChar (common attributes) /&gt;</programlisting
></para>
<para
>У этого правила нет особых атрибутов.</para>
<para
>Правило находит символы C, заключенные в одинарные кавычки (например, <userinput
>'c'</userinput
>). Внутри одинарных кавычек может быть как одиночный символ, так и управляющая последовательность, более подробно ознакомиться с которыми можно в описании правила HlCStringChar.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>RangeDetect</term>
<listitem>
<para
>Проверка на строку, имеющую заданные начальный и конечный символы.</para>
<programlisting
>&lt;RangeDetect char=&quot;(character)&quot; char1=&quot;(character)&quot; (common attributes) /&gt;</programlisting>
<para
><userinput
>char</userinput
> определяет символ, с которого начинается строка, а <userinput
>char1</userinput
> - которым она заканчивается.</para>
<para
>Это правило может быть использовано для поиска небольших строк, заключенных в кавычки, но, поскольку при проверке правила система подсветки работает с одной строкой, данное правило не сможет определить строку, разбитую символами перевода.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>LineContinue</term>
<listitem>
<para
>Проверка на символ перевода строки.</para>
<programlisting
>&lt;LineContinue (common attributes) /&gt;</programlisting>
<para
>У этого правила нет особых атрибутов.</para>
<para
>Это правило может быть удобно для переключения контекста в конце строки, если последним знаком будет обратная черта (<userinput
>'\'</userinput
>). Это необходимо, например, в языках C/C++ для продолжения макросов и строк.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>IncludeRules</term>
<listitem>
<para
>Включение правил из другого контекста или языка/файла.</para>
<programlisting
>&lt;IncludeRules context=&quot;contextlink&quot; [includeAttrib=&quot;true|false&quot;] /&gt;</programlisting>
<para
>Атрибут <userinput
>context</userinput
> определяет контекст, из которого берётся правило.</para>
<para
>Если это простая строка, то включаются все правила из другого контекста, например: <programlisting
>&lt;IncludeRules context=&quot;anotherContext&quot; /&gt;</programlisting
></para>
<para
>Если строка начинается с <userinput
>##</userinput
>, то система подсветки найдёт описание для другого языка с указанным названием, например: <programlisting
>&lt;IncludeRules context=&quot;##C++&quot; /&gt;</programlisting
></para>
<para
>Если <userinput
>includeAttrib</userinput
> выставить <emphasis
>true</emphasis
>, атрибут назначения должен быть таким же, как атрибут источника. Это необходимо, например, при вводе комментариев, если текст, соответствующий включаемому контексту, имеет иную подсветку, чем основной контекст. </para>
</listitem>
</varlistentry>
<varlistentry>
<term
>DetectSpaces</term>
<listitem>
<para
>Поиск пробелов.</para>
<programlisting
>&lt;DetectSpaces (common attributes) /&gt;</programlisting>
<para
>У этого правила нет особых атрибутов.</para>
<para
>Используйте это правило, если вы уверены, что в тексте есть несколько пробелов подряд, например в начале строк с отступом. Это правило поможет пропустить все пробелы разом, вместо проверки каждого из них по нескольким параметрам.</para>
</listitem>
</varlistentry>
<varlistentry>
<term
>DetectIdentifier</term>
<listitem>
<para
>Поиск строк идентификаторов (таких как регулярные выражения: [a-zA-Z_][a-zA-Z0-9_]*).</para>
<programlisting
>&lt;DetectIdentifier (common attributes) /&gt;</programlisting>
<para
>У этого правила нет особых атрибутов.</para>
<para
>Используйте это правило, чтобы пропустить все буквенные символы разом, вместо проверки каждого из них по нескольким параметрам.</para>
</listitem>
</varlistentry>
</variablelist>
</sect2>
<sect2>
<title
>Подсказки &amp; Советы</title>
<itemizedlist>
<para
>Усвоив принцип действия переключения контекста, вы без труда сможете написать своё определение подсветки. Подумайте о том, в какой ситуации какое правило следует применить. Регулярные выражения - мощное средство, но, по сравнению с другими правилами, очень медленное. Поэтому стоит воспользоваться следующими советами. </para>
<listitem>
<para
>Проверяя на соответствие только пару символов, воспользуйтесь <userinput
>Detect2Chars</userinput
> вместо <userinput
>StringDetect</userinput
>. То же относится к <userinput
>DetectChar</userinput
>.</para>
</listitem>
<listitem>
<para
>Регулярные выражения несложны в использовании, но очень часто можно найти более быстрый способ. Допустим, вы ищете символ <userinput
>'#'</userinput
>, это первый символ строки. Решение с регулярным выражением будет выглядеть примерно так: <programlisting
>&lt;RegExpr attribute=&quot;Macro&quot; context=&quot;macro&quot; String=&quot;^\s*#&quot; /&gt;</programlisting
>. Этой же цели можно достичь значительно быстрее: <programlisting
>&lt;DetectChar attribute=&quot;Macro&quot; context=&quot;macro&quot; char=&quot;#&quot; firstNonSpace=&quot;true&quot; /&gt;</programlisting
>. Для поиска регулярного выражения <userinput
>'^#'</userinput
> можно применить <userinput
>DetectChar</userinput
> с атрибутом <userinput
>column=&quot;0&quot;</userinput
>. Отсчет для атрибута <userinput
>column</userinput
> идет посимвольно, поэтому знак табуляции для него - всего один символ. </para>
</listitem>
<listitem>
<para
>Можно переключать контексты без специальных символов. Допустим, вы хотите переключить контекст при достижении строки <userinput
>*/</userinput
>, но в новом контексте хотите продолжить обработку этой строки. Можно воспользоваться нижеследующим правилом, а атрибут <userinput
>lookAhead</userinput
> заставит систему подсветки сохранить найденную строку для нового контекста. <programlisting
>&lt;Detect2Chars attribute=&quot;Comment&quot; context=&quot;#pop&quot; char=&quot;*&quot; char1=&quot;/&quot; lookAhead=&quot;true&quot; /&gt;</programlisting>
</para>
</listitem>
<listitem>
<para
>Если известно, что в тексте много пробелов, воспользуйтесь <userinput
>DetectSpaces</userinput
>.</para>
</listitem>
<listitem>
<para
>Пользуйтесь <userinput
>DetectIdentifier</userinput
> вместо регулярного выражения <userinput
>'[a-zA-Z_]\w*'</userinput
>.</para>
</listitem>
<listitem>
<para
>Старайтесь использовать стандартные стили, это удобно для пользователя.</para>
</listitem>
<listitem>
<para
>Заглянув в другие XML-файлы, вы узнаете много нового о работе с правилами.</para>
</listitem>
<listitem>
<para
>Проверить правильность XML-файла можно командой <command
>xmllint --dtdvalid language.dtd mySyntax.xml</command
>.</para>
</listitem>
<listitem>
<para
>Если сложное регулярное выражение встречается часто, воспользуйтесь <emphasis
>ENTITIES</emphasis
>. Пример:</para>
<programlisting
>&lt;?xml version="1.0" encoding="UTF-8"?&gt;
&lt;!DOCTYPE language SYSTEM "language.dtd"
[
&lt;!ENTITY myref "[A-Za-z_:][\w.:_-]*"&gt;
]&gt;
</programlisting>
<para
>Теперь вместо регулярного выражения можно использовать <emphasis
>&amp;myref;</emphasis
>.</para>
</listitem>
</itemizedlist>
</sect2>
</sect1>
</appendix>