Arbejde med Fremhævning

&erik.kjaer.pedersen.role; Arbejde med Fremhævning Overblik Syntaksfremhævning er det der får en editor til automatisk at vise tekst i forskellig stil/farve, afhængig af funktionen for strengen i relation til filens formål. I kildekode til et program for eksempel, kan kontroludsagn blive vist som fede, mens datatyper og kommentarer får forskellige farver fra resten af teksten. Dette gør det meget nemmere at læse teksten, og hjælper således forfatteren med at være mere effektiv og produktiv. En perl-funktion, vist med syntaksfremhævning. En perl-funktion, vist med syntaksfremhævning. Den samme perl-funktion, uden fremhævning. Den samme perl-funktion, uden fremhævning. Af de to eksempler, hvilket er nemmest at læse? &kate; kommer med et fleksibelt, indstilleligt og brugbart system til at lave syntaksfremhævning, og standarddistributionen giver definitioner for et vidt omfang af programmerings-, script- og opmarkeringssprog og andre tekstfil-formater. Derudover kan du give dine egne definitions i simple &XML;-filer. &kate; vil detektere de rigtige syntaksregler automatisk når du åbner en fil, baseret på filens &MIME;-type, bestemt ved dens endelse, eller, hvis den ingen har, indholdet. Skulle du komme ud for et dårligt valg, kan du sætte syntaksen der skal bruges manuelt fra DokumenterFremhævningstilstand-menuen. Den stil og de farver som bruges af hvert syntaksfremhævningstilstand kan indstilles på siden Udseende i indstillingsdialogen, mens de &MIME;-typer de skal bruges til håndteres på siden Fremhævning. Syntaksfremhævning er der for at gøre det nemmer at læse rigtig tekst, men du kan ikke stole på at det vil være en godkendelse af din tekst. Markering af tekst for syntaks er vanskeligt og afhængigt af det format du bruger, og i visse tilfælde vil forfatterne af syntaksreglerne være stolte hvis 98% af teksten blive vist rigtigt, selvom du for det meste skal bruge en sjælden stil for at se de ukorrekte 2%. Du kan downloade opdaterede eller ekstra syntaksfremhævningsdefinitioner fra &kate;'s netside ved at klikke på Download-knappen i Fremhæv siden for Config-dialogen. &kate;'s syntaksfremhævning-system dette afsnit vil diskutere &kate;'s syntaksfremhævning-mekanismen i større detalje. Det er beregnet på dig, hvis du gerne vil kende til det, eller hvis du ønsker at ændre eller lave syntaksdefinitioner. Hvordan virker det Når du åbner en fil er en af de første ting som &kate;-editoren gør at detektere hvilke syntaksdefinitioner der skal bruges for filen. Mens filens tekst læses, og mens du skriver i den, vil syntaksfremhævningssystemet analysere teksten ved brug af de regler der er defineret af syntaksdefinitioner og markere i filen hvor forskellige sammenhænge og stiler begynder og slutter. Når du skriver i dokumentet, bliver den nye tekst analyseret og markeret langs af sted, så hvis du sletter et tegn der er markeret som begyndelsen eller slutningen af en sammenhæng, vil stilen for den omgivende tekst ændret tilsvarende. De syntaksdefinitioner der bruges af &kate;'s syntaksfremhævningssystem er &XML;-filer der indeholder Regler til at detektere tekstens rolle, organiseret i sammenhængsblokke Nøgleordslister Stilpunkt-definitioner Når teksten analyseres, bliver detektionsreglerne evalueret i den rækkefølge i hvilken de er defineret, og hvis begyndelsen af den aktuelle streng matcher en regel, bruges den relaterede sammenhæng. Startpunktet i teksten flyttes til slutpunktet for hvilket denne regel matcher og en ny løkke af regler begynder, startende i den sammenhæng der er sat af den matchede regel. Regler Detektionsreglerne er hjertet af fremhævnings-detektionssystemet. En regel er en streng, et tegn eller et regulært udtryk mod hvilken den tekst der bliver analyseret skal matches. Den indeholder information om hvilken stile der skal bruges for den matchende del af teksten. Den vil muligvis skifte arbejdssammenhæng for systemet enten til en eksplicit nævnt sammenhæng eller til den tidligere sammenhæng brugt af teksten. Regler er organiserede i sammenhængsgrupper. En sammenhængsgruppe bruges til hovedtekstbegreber indenfor formatet, for eksempel citerede tekststrenge eller kommentar-blokke i programmers kildekode. Dette sikrer at fremhævningen ikke behøver at gå i løkke gennem alle regler når det ikke er nødvendigt, og at visse tegnsekvenser i teksten kan behandles anderledes afhængig af den aktuelle sammenhæng. Sammenhænge kan skabes dynamisk for eksempel for at tillade brug af instansspecifikke data i regler. Sammenhængsstil og nøgleord I visse programmeringssprog, bliver heltal behandlet anderledes end decimaltal af compileren (det program der konverterer kildekode til en binær kørbar), og der kan være tegn der har en speciel betydning indenfor en citeret streng. I sådanne tilfælde, giver det mening at vise dem anderledes end omgivelserne, så de er nemme at identificere mens man læser teksten. Så selvom de ikke repræsenterer specielle sammenhænge, kan de ses som sådan af syntaksfremhævningssystemet, så de kan markeres til en anderledes fremvisning. En syntaksdefinition kan indeholde så mange stile som krævet for at dække begreberne for det format den bruges til. I mange formater, er der lister af ord der repræsenterer et bestemt begreb. For eksempel i programmeringssprog, er kontroludsagn et begreb, datatypenavne et andet, og indbyggede funktioner i sproget et tredje. &kate;'s syntaksfremhævningssystem kan bruge sådanne lister til at detektere og markere ord i teksten for at understrege begreber fra tekstformaterne. Standardstil Hvis du åbner en C++ kildefil, en &Java; kildefil og et HTML-dokument i &kate;, vil du se at selvom formaterne er forskellige, og forskellige ord således vælges til speciel behandling, er de brugte farver de samme. Det er fordi &kate; har en prædefineret liste af standardstile, som anvendes af de individuelle syntaksdefinitioner. Dette gør det nemt at genkende lignende begreber i forskellige tekstformater. For eksempel er kommentarer til stede i næsten programmerings-, script- eller opmarkeringssprog, og når de vises ved brug af den samme stil i alle sprog, skal du ikke stoppe op og tænke dig om for at identificere dem indenfor teksten. Alle stile i en syntaksdefinition bruger en af stadardstilene. Nogle få syntaksdefinitioner bruger flere stile end der er som standard, så hvis du bruger et format ofte, er det måske besværet værd at starte indstillingsdialogen for at se om nogle begreber bruger den samme stil. For eksempel er der kun en standardstil for strenge, men da perl programmeringssproget opererer med to typer strenge, kan du udvide fremhævningen ved at indstille disse til at være en smule forskellige. Alle tilgængelige standardstiler vil blive forklaret senere. Fremhævningsdefinitionen &XML;-format Overblik Dette afsnit er et overblik over fremhævningsdefinitionen &XML;-format. Det vil beskrive hovedkomponenterne og deres betydning og brug, baseret på et lille eksempel. Næste afsnit vil gå i detaljer angående fremhævningsdetektionsreglerne. Den formelle definition, også kendt som DTD gemmes i filen language.dtd som skal være installeret på dit system i mappen $TDEDIR/share/apps/katepart/syntax. Hovedafsnit i &kate;'s fremhævningsdefinitioner En syntaksfremhævelsesfil indeholder et hoved som angiver XML-versionen og dokumenttypen: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE language SYSTEM "language.dtd"> Definitionsfilens rod er elementet language. Følgende egenskaber er tilgængelige: Egenskaber som kræves: section angiver kategorien. extensions definerer filendelser, som "*.cpp;*.h". Valgfrie egenskaber: mimetype tilknytter filer baseret på &MIME;-type. version angiver definitionsfilens nuværende version. kateversion angiver seneste version af &kate; som understøttes. casesensitive definerer om nøgleord er versalfølsomme eller ej. priority kræves hvis en anden syntaksfremhævelsesfil bruger samme filendelse. Den højeste prioritet vinder. author indeholder forfatterens navn og e-mail-adresse. license indeholder licensen, oftest LGPL, Artistic, GPL og andre. hidden definerer om navnet skal vises i &kate;s menuer. Næste linje kan altså se sådan her ud: <language name="C++" version="1.00" kateversion="2.4" section="Sources" extensions="*.cpp;*.h" /> Derefter kommer elementet highlighting som indeholder det valgfrie element list og de krævede elementer contexts og itemDatas. list elementer indeholder en liste med nøgleord. I dette tilfælde er nøgleordene class og const. Du kan tilføje så mange lister som du behøver. Elementet contexts indeholder alle sammenhænge. Den første sammenhæng er standard som start for fremhævelsen. Der er to regler i sammenhængen Normal Text som matcher listen af nøgleord med navnet et-navn og en regel som detekterer et citationstegn og skifter sammenhæng til string. For at lære dig mere om regler, læs næste kapitel. Den tredje del er elementet itemDatas. Det indeholder alle farver og skrifttypestiler som behøves af sammenhængen og reglerne. I dette eksempel bruges itemData Normal Text, String og Keyword. <highlighting> <list name="somename"> <item> class </item> <item> const </item> </list> <contexts> <context attribute="Normal Text" lineEndContext="#pop" name="Normal Text" > <keyword attribute="Keyword" context="#stay" String="somename" /> <DetectChar attribute="String" context="string" char=""" /> </context> <context attribute="String" lineEndContext="#stay" name="string" > <DetectChar attribute="String" context="#pop" char=""" /> </context> </contexts> <itemDatas> <itemData name="Normal Text" defStyleNum="dsNormal" /> <itemData name="Keyword" defStyleNum="dsKeyword" /> <itemData name="String" defStyleNum="dsString" /> </itemDatas> </highlighting> Den sidste del af fremhævelsesdefinitionen er det valgfrie afsnit general. Det kan indeholde information om nøgleord, kodefoldning, kommentarer og indentering. Afsnittet comment definerer den streng som kommentarer på en linje indledes med. Du kan også definere kommentarer på flere linjer med multiLine og den yderligere egenskab end. Dette er nyttigt når brugeren trykker på genvejstaster som svarer til kommentér/afkommentér. Afsnittet keywords definerer om lister med nøgleord er versalfølsomme eller ej. Andre egenskaber forklares senere. <general> <comments> <comment name="singleLine" start="#"/> </comments> <keywords casesensitive="1"/> </general> </language> Afsnittene i detalje Denne del beskriver alle tilgængelige egenskaber for sammenhæng, itemData, nøgleord, kommentarer, kodefoldning og indentering. Elementet context hører til gruppen contexts. Selve sammenhænget definerer sammenhængsspecifikke regler, såsom hvad der skal ske hvis fremhævelsessystemet når slutningen på en linje. Tilgængelige egenskaber er: name er sammenhængens navn. Regler bruger navnet til at angive sammenhængen at skifte til hvis reglen matcher. lineEndContext definerer sammenhængen som fremhævelsessystemet skifter til hvis det når til et linjebrud. Det kan enten være navnet på en andet sammenhæng, #stay for ikke at skifte sammenhæng (dvs. gøre ingenting) eller #pop som gør at sammenhængen forlades. Det er for eksempel muligt at bruge #pop#pop#pop for at gå tre skridt tilbage. lineBeginContext definerer sammenhængen hvis begyndelsen på en linje mødes. Standard: #stay. fallthroughdefinerer om fremhævelsessystemet skifter til sammenhængen som angives i fallthroughContext hvis ingen regel matcher. Standard: false. fallthroughContext angiver næste sammenhæng hvis ingen regel matcher. dynamic hvis true husker sammenhængen strenge/pladsmarkører som gemt af dynamiske regler. Det behøves for eksempel for HERE-dokumenter. Standard: false. Elementet itemData er i gruppen itemDatas. Det definerer skrifttypestilen og farverne. Det er altså muligt at definere egne stiler og farver, men vi anbefaler dog at du holder dig til standardstil om muligt, så brugeren altid ser samme farver brugt i forskellige sprog. Sommetider er der dog ingen anden måde, og det er nødvendigt at ændre farve- og tegnegenskaber. Egenskabens navn og defStyleNum kræves, øvrige er valgfrie. Tilgængelige egenskaber er: name angiver navnet på itemData. Sammenhæng og regler bruger navnet i egenskaben attribute til at referere til itemData. defStyleNum definerer hvilken standardstil som skal bruges. Tilgængelige standardstiler forklares i detalje senere. color definerer en farve. Gyldige formater er '#rrggbb' eller '#rgb'. selColor definerer markeringens farve. italic hvis true, er teksten kursiv. bold hvis true, er teksten i fede typer. underline hvis true, er teksten understreget. strikeout hvis true, er teksten overstreget. Elementet keywords i gruppen general definerer nøgleordenes egenskaber. Tilgængelige egenskaber er: casesensitive kan være true eller false. Hvis det er true, matches alle nøgleord versalfølsomt. weakDeliminator er en liste med tegn som ikke fungerer som ordgrænser. Punktum '.' er for eksempel en ordgrænse. Antag at et nøgleord i en list indeholder et punktum, så matcher det kun hvis du angiver at punktummet er en svag afgrænser. additionalDeliminator definerer yderligere grænser. wordWrapDeliminator definerer tegn som et linjeskift kan ske efter. Standardgrænser og linjeskiftgrænser er tegnene .():!+,-<=>%&*/;?[]^{|}~\, mellemrum (' ') og tabulator ('\t'). Elementet comment i gruppen comments definerer kommentaregenskaber som bruges for Værktøj Kommentér og Værktøj Afkommentér. Tilgængelige egenskaber er: name er enten singleLine eller multiLine. Hvis du vælger multiLine kræves egenskaberne end og region. start definerer strengen som bruges til at indlede en kommentar. I C++ ville det være "/*". end definerer strengen som bruges til at afslutte en kommentar. I C++ ville det være "*/". region skal være navnet på den foldelige kommentar på flere linjer. Antag at du har beginRegion="Comment" ... endRegion="Comment" i dine regler, så skal du bruge region="Comment". På denne måde fungerer afkommentering også selvom du ikke markerer al tekst i en kommentar på flere linjer. Markøren skal blot være inde i multilinjekommentaren. Elementet folding i gruppen general definerer kodefoldningsegenskaber. Tilgængelige egenskaber er: indentationsensitive hvis true tilføjes kodefoldningsmarkørerne baseret på indentering, ligesom i scriptsproget Python. Som regel behøver du ikke angive det, eftersom det har standardværdien false. Elementet indentation i gruppen general definerer hvilken identerer som skal bruges, selvom vi stærkt anbefaler at udelade elementet, eftersom intentereren oftest angives ved at definere en filtype eller ved at tilføje tilstandslinjer i tekstfilen. Hvis du alligevel angiver en indenterer, tvinger du brugeren til at bruge en specifik indentering, hvilket måske ikke værdsættes over hovedet. Tilgængelige egenskaber er: mode er navnet på indentereren. Indenterere som for øjeblikket er tilgængelige er:normal, cstyle, csands, xml, python og varindent. Tilgængelige standardstiler Standardstiler er allerede forklaret. En kort sammenfatning: Standardstiler er fordefinerede stiler for skrifttype og farver. Så her er altså blot listen med tilgængelige standardstiler: dsNormal, bruges til normal tekst. dsKeyword, bruges til nøgleord. dsDataType, bruges til datatyper. dsDecVal, bruges til decimale værdier. dsBaseN, bruges til værdier med en basis andet end 10. dsFloat, bruges til decimaltal. dsChar, bruges til et tegn. dsString, bruges til strenge. dsComment, bruges til kommentarer. dsOthers, bruges til 'andre' ting. dsAlert, bruges til advarselsmeddelelser. dsFunction, bruges til funktionskald. dsRegionMarker, bruges til områdesmarkeringer. dsError, bruges til fremhævning af fejl og forkert syntaks. Fremhævningsdetektionsregler Dette afsnit beskriver syntaksdetektionsregler. Hver regel kan matche nul eller flere tegn i begyndelsen af strengen de bliver bedt om at teste imod. Hvis reglen matcher, bliver de matchende tegn tilknyttet stilen eller attributten defineret af reglen, og en regel vil måske spørge om den aktuelle sammenhæng er skiftet. En regel ser sådan her ud: <RuleName attribute="(identifier)" context="(identifier)" [regelspecifikke attributter] /> Attributten identificerer den stil der skal bruges til matchede tegn ved navn, og sammenhængen identificerer sammenhængen der skal bruges fra nu af. Sammenhængen kan identificeres ved: En identifikatorsom er navnet på den anden sammenhæng. En rækkefølge der fortæller maskinen at den skal forblive i den aktuelle sammenhæng (#stay), eller poppe tilbage til en tidligere sammenhæng brugt i strengen (#pop). For at flere trin tilbage, kan #pop-nøgleordet gentages: #pop#pop#pop Nogle regler kan have afledte regler som så bliver evaluerede hvis den oprindelige regel matches. Hele den matchede streng vil blive givet attributten defineret af den oprindelige regel. En regel med afledte regler ser sådan her ud: <RuleName (attributes)> <ChildRuleName (attributes) /> ... </RuleName> Regelspecifikke attributter varierer og beskrives i følgende afsnit. Almindelige attributter Alle regler har følgende egenskaber fælles og er tilgængelige på alle steder (fælles egenskaber) vises. Egenskaberne attribute og context er nødvendige, alle øvrige er valgfrie. attribute: En egenskab afbildes til et defineret itemData. context: Angiver sammenhænge som fremhævningssystemet skifter til hvis reglen matcher. beginRegion: Indled en kodefoldningsblok. Standard: unset. endRegion: Afslut en kodefoldningsblok. Standard: unset. lookAhead: Hvis true behandler ikke fremhævningssystemet matchningens længde. Standard: false. firstNonSpace: Match kun hvis strengen er den første udover blanke tegn på linjen. Standard: false. column: Match kun hvis søjlen matcher. Forval: unset. Dynamiske regler Visse regler tillader den valgfrie egenskab dynamic med Boolesk type, som har standardværdi false. Hvis dynamic er true, kan en regel bruge pladsmarkører som repræsenterer teksten som matches af en regel med et regulært udtryk som skifter til nuværende sammenhæng med sin egenskab string eller char. I en string erstattes pladsmarkøren %N (hvor N er et tal) med tilsvarende N i det kaldende regulære udtryk. I en char skal pladsmarkøren være et tal N og det erstattes med det første tegn i tilsvarende N i det kaldende regulære udtryk. Nårsomhelst en regel tillader denne egenskab, indeholder den (dynamic). dynamic: kan være (true | false). Reglerne i detalje DetectChar Detekterer et enkelt tegn. Almindeligt brugt for eksempel til at finde slutningen af citerede strenge. <DetectChar char="(character)" (almindelige attributter) (dynamisk) /> char-attributten definerer tegnet der skal matches. Detect2Chars Detekterer to specifikke tegn i en defineret rækkefølge. <Detect2Chars char="(tegn)" char1="(tegn)" (almindelige attributter) (dynamisk) /> char-attributten definerer det første tegn der skal matches, char1 det andet. AnyChar Detekterer et tegn fra et bestemt sæt angivne tegn. <AnyChar String="(string)" (almindelige attributter) /> Streng-attributten definerer sættet af tegn. StringDetect Detekterer en eksakt streng. <StringDetect String="(string)" [insensitive="true|false;"] (almindelige attributter) (dynamisk) /> Streng-attributten definerer strengen der skal matches. insensitive-attributten er som standard false og fødes til strengsammenligningsfunktionen. Hvis værdien er true bruges insensitive sammenligning. RegExpr Matcher mod et regulært udtryk. <RegExpr String="(string)" [insensitive="true|false;"] [minimal="true|false"] (almindelige attributter) (dynamisk) /> Streng-attributten definerer det regulære udtryk. insensitive er som standard false og videregives til den regulære udtryksmaskine. minimal er som standard false og viederegives til den regulære udtryksmaskine. Fordi reglerne altid matches imod begyndelsen af den aktuelle streng, vil et regulært udtryk der starter med en karet (^) indikere at reglen kun skal matches mod begyndelsen af en linje. Se Regulære udtryk for yderligere oplysninger om disse. nøgleord Detektér et nøgleord fra en bestemt liste. <keyword String="(list name)" (almindelige attributter) /> String-attributten identificerer nøgleordslisten ved navn. En liste med dette navn skal eksistere. Int Detektér et heltal. <Int (almindelige attributter) (dynamisk) /> Denne regel har ingen specifikke attributter. Afledte regler bruges typisk til at detektere kombinationer af L og U efter tallet, indikerende heltalstypen i programkode. Rent faktisk er alle regler tilladte som afledte regler, selvom DTD'en kun tillader den afledte regel StringDetect. Følgende eksempel matcher heltal som følges af tegnet 'L'. <Int attribute="Decimal" context="#stay" > <StringDetect attribute="Decimal" context="#stay" String="L" insensitive="true"/> </Int> Decimaltal Detektér et decimaltal. <Float (almindelige attributter) /> Denne regel har ingen specifikke egenskaber. AnyChar tillades som en delregel, og bruges typisk for at detektere kombinationer, se reglen Int for en reference. HlCOct Detektér en oktal pointnummer repræsentation. <HlCOct (almindelige attributter) /> Denne regel har ingen specifikke attributter. HlCHex Detektér en hexadecimal nummerrepræsentation. <HlCHex (almindelige attributter) /> Denne regel har ingen specifikke attributter. HlCStringChar Detektér et escape-tegn. <HlCStringChar (almindelige attributter) /> Denne regel har ingen specifikke attributter. Den matcher bogstavelige repræsentationer af tegn som er almindeligt brugte i programkode, for eksempel \n (nylinje) eller \t (TAB). Følgende tegn vil matche hvis de følger efter en baglæns skråstreg (\): abefnrtv"'?\. Derudover vil escape-hexadecimale tal som for eksempel \xff og escape-oktale tal, for eksempel \033 matche. HlCChar Detektér et C-tegn. <HlCChar (almindelige attributter) /> Denne regel har ingen specifikke attributter. Det matcher C-tegn omgivet af apostrofer (for eksempel 'c'). Der kan være et enkelt tegn eller en tegnefølge indenfor apostrofferne. Se HlCStringChar for matchede tegnfølgder. RangeDetect Detekterer en streng med defineret start- sluttegn. <RangeDetect char="(character)" char1="(character)" (almindelige attributter) /> char definerer tegnet der starter området, char1 tegnet der afslutter området. Nyttigt til at detektere for eksempel små citerede strenge og den slags, men bemærk at fordi fremhævningsmaskinen virker på én linje af gangen, vil den ikke finde strenge der går udover et linjebrud. LineContinue Matcher slutningen af linjen. <LineContinue (almindelige attributter) /> Denne regel har ingen specifikke attributter. Denne regel er nyttig til at skifte sammenhæng ved linjeskift, hvis det sidste tegn er en baglæns skråstreg ('\'). Dette behøves for eksempel i C/C++ for at fortsætte makroer eller strenge. IncludeRules Inkludér regler fra et anden sammenhæng eller sprog/fil. <IncludeRules context="sammenhængslink" [includeAttrib="true|false"] /> Egenskaben context definerer hvilken sammenhæng som skal inkluderes. Hvis den er en enkelt streng indeholder den alle definerede regler i den nuværende sammenhæng, for eksempel: <IncludeRules context="anden-sammenhæng" /> Hvis strengen begynder med ## leder syntaksfremhævningssystemet efter en anden sprogdefinition med det givne navn, for eksempel: <IncludeRules context="##C++" /> Hvis egenskaben includeAttrib er true, ændres målegenskaben til kildens egenskab. Dette kræves for eksempel for at kommentarer skal virke hvis tekst som matches af den inkluderede sammenhæng har en anden fremhævning end værtsammenhængen. DetectSpaces Detektér blanke tegn. <DetectSpaces (almindelige attributter) /> Denne regel har ingen specifikke attributter. Brug denne regel hvis du véd at der kan være flere blanke tegn foran, for eksempel i begyndelsen af indrykkede linjer. Reglen springer over alle blanke tegn på en gang, i stedet for at prøve flere regler og springe over en af gangen eftersom den ikke matcher. DetectIdentifier Detektér strenge for identifikator (som et regulært udtryk: [a-zA-Z_][a-zA-Z0-9_]*). <DetectIdentifier (fælles egenskaber) /> Denne regel har ingen specifikke attributter. Brug denne regel for at springe over en streng med ordtegn på en gang, i stedet for at teste den med flere regler og springe over et af gangen afhængig af at ingenting matcher. Vink og tricks Når du har forstået hvordan sammenhængsskift virker bliver det nemt at skrive fremhævningsdefinitioner. Du bør alligevel nøje kontrollere hvilken regel du vælger i hvilken situation. Regulære udtryk er meget kraftfulde, men de er langsomme sammenlignet med andre regler. Du bør derfor tage hensyn til følgende vink. Hvis du kun matcher to tegn, brug Detect2Chars i stedet for StringDetect. Det samme for DetectChar. Regulære udtryk er nemme at bruge, men oftest er der en anden meget hurtigere måde at opnå samme resultat. Antag at du kun vil matche tegnet '#' hvis det er det første tegn på en linje. En løsning baseret på regulære udtryk ville se sådan ud: <RegExpr attribute="Macro" context="macro" String="^\s*#" /> Du kan opnå det samme meget hurtigere med: <DetectChar attribute="Macro" context="macro" char="#" firstNonSpace="true" /> Hvis du vil matche det regulære udtryk '^#' kan du stadigvæk bruge DetectChar med egenskaben column="0". Egenskaben column tæller baseret på tegn, så en tabulator er stadigvæk kun et tegn. Du kan skifte sammenhæng uden at behandle tegn. Antag at du vil skifte sammenhæng når du støder på strengen */, men skal behandle denne streng i næste sammenhæng. Reglen nedenfor matcher, og egenskaben lookAhead gør at fremhævningen beholder den matchede strengen for næste sammenhæng. <Detect2Chars attribute="Comment" context="#pop" char="*" char1="/" lookAhead="true" /> Brug DetectSpaces hvis du véd at mange blanke tegn forekommer. Brug DetectIdentifier i stedet for et regulært udtryk '[a-zA-Z_]\w*'. Brug standardstiler overalt du kan. På den måde finder brugeren et bekendt miljø. Kig i andre XML-filer for at se hvordan andre implementerede trickede regler. Du kan validere alle XML-filer ved at bruge kommandoen xmllint --dtdvalid language.dtd min-syntax.xml. Hvis du meget ofte gentager komplekse regulære udtryk kan du bruge ENTITETER. For eksempel: <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE language SYSTEM "language.dtd" [ <!ENTITY minref "[A-Za-z_:][\w.:_-]*"> ]> Nu kan du bruge &minref; i stedet for det regulære udtryk.