HTTP ශීර්ෂ සඳහා ආකෘතිය HTTP පිරිවිතරයෙන් අර්ථ දක්වා ඇත. මම HTTP 1.1 ගැන කතා කරන්නෙමි, ඒ සඳහා පිරිවිතර RFC 2616 වේ. 4.2, 'පණිවිඩ ශීර්ෂයන්' හි, ශීර්ෂයක සාමාන්ය ව්යුහය අර්ථ දක්වා ඇත:
message-header = field-name ":" [ field-value ]
field-name = token
field-value = *( field-content | LWS )
field-content = <the OCTETs making up the field-value
and consisting of either *TEXT or combinations
of token, separators, and quoted-string>
මෙම අර්ථ දැක්වීම ප්රධාන කුළුණු දෙකක් මත රඳා පවතී, ටෝකන් සහ ටෙක්ස්ට්. දෙකම 2.2, 'මූලික රීති' හි අර්ථ දක්වා ඇත. ටෝකනය යනු:
token = 1*<any CHAR except CTLs or separators>
අනෙක් අතට CHAR, CTL සහ බෙදුම්කරුවන් මත රැඳී සිටීම:
CHAR = <any US-ASCII character (octets 0 - 127)>
CTL = <any US-ASCII control character
(octets 0 - 31) and DEL (127)>
separators = "(" | ")" | "<" | ">" | "@"
| "," | ";" | ":" | "\" | <">
| "/" | "[" | "]" | "?" | "="
| "{" | "}" | SP | HT
TEXT යනු:
TEXT = <any OCTET except CTLs,
but including LWS>
LWS යනු රේඛීය සුදු අවකාශයක් වන අතර, එහි අර්ථ දැක්වීම මම ප්රතිනිෂ්පාදනය නොකරමි, සහ OCTET යනු:
OCTET = <any 8-bit sequence of data>
අර්ථ දැක්වීම සමඟ සටහනක් ඇත:
The TEXT rule is only used for descriptive field contents and values
that are not intended to be interpreted by the message parser. Words
of *TEXT MAY contain characters from character sets other than ISO-
8859-1 [22] only when encoded according to the rules of RFC 2047
[14].
ඉතින්, නිගමන දෙකක්. පළමුවෙන්ම, ශීර්ෂ නාමය ASCII අක්ෂරවල උප කුලකයකින් සෑදිය යුතු බව පැහැදිලිය - අක්ෂර සංඛ්යා, සමහර විරාම ලකුණු, වෙනත් බොහෝ නොවේ. දෙවනුව, ශීර්ෂක අගය අර්ථ දැක්වීමේදී එය ASCII ට සීමා කරන හෝ බිටු 8 අක්ෂර බැහැර කරයි: එය පැහැදිලිවම අෂ්ටක වලින් සමන්විත වන අතර පාලක අක්ෂර පමණක් තහනම් කර ඇත (CR සහ LF පාලනයන් ලෙස සලකන බව සලකන්න). තව දුරටත්, ටෙක්ස්ට් නිෂ්පාදනය පිළිබඳ අදහස් දැක්වීමේදී ඇඟවෙන්නේ අෂ්ටක ISO-8859-1 ලෙස අර්ථ දැක්විය යුතු බවත්, එම කේතන ක්රමයෙන් පිටත අක්ෂර නිරූපණය කිරීම සඳහා කේතීකරණ යාන්ත්රණයක් (එය භයානක, අහම්බෙන්) ඇති බවත් ය.
එබැවින්, alBalusC වෙත විශේෂයෙන් ප්රතිචාර දැක්වීමට, පිරිවිතරයන්ට අනුව, ශීර්ෂ අගයන් ISO-8859-1 හි ඇති බව පැහැදිලිය. මම ටොම්කාට් වෙතින් ශීර්ෂ පා in යක් තුළ ඉහළ -8859-1 අක්ෂර (විශේෂයෙන් ප්රංශ භාෂාවෙන් භාවිතා කර ඇති ස්වර කිහිපයක්) යවා ඒවා ෆයර්ෆොක්ස් විසින් නිවැරදිව අර්ථ නිරූපණය කර ඇත්තෙමි, එබැවින් යම් තාක් දුරට මෙය ප්රායෝගිකව මෙන්ම න්යායෙන් ද ක්රියාත්මක වේ (මෙය URL එකක් අඩංගු ස්ථාන ශීර්ෂයක් වුවද, මෙම අක්ෂර URL වල නීත්යානුකූල නොවන බැවින් මෙය ඇත්ත වශයෙන්ම නීති විරෝධී ය, නමුත් වෙනත් රීතියක් යටතේ!).
එයින් කියැවෙන්නේ, මම සියලු සේවාදායකයන්, ප්රොක්සි සහ සේවාදායකයින් හරහා වැඩ කරන අයිඑස්ඕ -8859-1 මත විශ්වාසය නොතබන බැවින් ආරක්ෂිත වැඩසටහන්කරණයේ කාරණයක් ලෙස මම ASCII වෙත ඇලී සිටිමි.