කෙටි එක සමඟ යාමට තවත් හේතුවක් නම්, ඔබ සලකුණු කිරීමේදී අක්ෂර කට්ටලයක් නියම කළ හැකි වෙනත් අවස්ථාවන්ට එය ගැලපේ. උදාහරණයක් වශයෙන්:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
අනුකූලතාව දෝෂ අඩු කිරීමට සහ කේතය වඩාත් කියවිය හැකි කිරීමට උපකාරී වේ.
අක්ෂර කට්ටලය ආරෝපණ-සංවේදී නොවන බව සලකන්න. ඔබට UTF-8 හෝ utf-8 භාවිතා කළ හැකිය, කෙසේ වෙතත් UTF-8 පැහැදිලි, වඩා කියවිය හැකි, වඩාත් නිවැරදි ය.
එසේම, මෙටා අක්ෂර කට්ටලයේ හෝ පිටු ශීර්ෂයේ UTF-8 හැර වෙනත් අගයක් භාවිතා කිරීමට කිසිසේත් හේතුවක් නැත. යූටීඑෆ් -8 යනු 1999 දී HTML4 සිට වෙබ් ලේඛන සඳහා සුපුරුදු කේතීකරණය වන අතර නවීන වෙබ් පිටු සෑදීමේ එකම ප්රායෝගික ක්රමය වේ.
එසේම ඔබ UTF-8 හි HTML ආයතන භාවිතා නොකළ යුතුය. ප්රකාශන හිමිකම් සංකේතය වැනි අක්ෂර කෙලින්ම ටයිප් කළ යුතුය. ඔබ භාවිතා කළ යුතු එකම ආයතන වන්නේ වෙන් කළ සලකුණු 5 සඳහා ය: ඇම්පර්සෑන්ඩ්, ප්රයිම්, ඩබල් ප්රයිම් වලට වඩා අඩුය. ආයතනවලට HTML විග්රහයක් අවශ්ය වන අතර, එය ඔබට සැමවිටම ඉදිරියට යාමට අවශ්ය නොවනු ඇත, ඒවා දෝෂ හඳුන්වා දෙයි, ඔබේ කේතය අඩු කියවිය හැකි බවට පත් කරයි, ඔබේ ගොනු ප්රමාණය වැඩි කරයි, සහ සමහර විට ඔබ භාවිතා කළ ආයතන අනුව විවිධ බ්රව්සර්වල වැරදි ලෙස විකේතනය වේ. ප්රකාශන හිමිකම, වෙළඳ ලකුණ, විවෘත උපුටා දැක්වීම, සමීප උපුටා දැක්වීම, අපෝස්තලාපය, එම් ඩෑෂ්, එන් ඩෑෂ්, බුලට්, යූරෝ සහ ඔබේ අන්තර්ගතයේ ඔබට හමු වන වෙනත් අක්ෂර ටයිප් කරන්නේ කෙසේද සහ ඉගෙන ගන්නේ කෙසේද යන්න ඉගෙන ගෙන ඔබේ කේතයේ සත්ය අක්ෂර භාවිතා කරන්න. යතුරුපුවරු පද්ධති මනාපයෙන් ඔබට සක්රිය කළ හැකි අක්ෂර නරඹන්නෙකු මැක් සතුව ඇත, ඔබට අවශ්ය අක්ෂර සොයා ගැනීමට සහ ඇදගෙන යාමට හෝ ගැලපෙන යතුරුපුවරු නරඹන්නා භාවිතා කර යතුරු යතුරු ටයිප් කළ යුතු දැයි බැලීමට ඔබට හැකිය. උදාහරණයක් ලෙස, වෙළඳ ලකුණ විකල්ප + 2 වේ. UTF-8 සෑම ලිඛිත මිනිස් භාෂාවකින්ම සියලුම අක්ෂර සහ සංකේත අඩංගු වේ. එබැවින් භාවිතා කිරීම සඳහා නිදහසට කරුණක් නැත - එම් ඩෑෂ් වෙනුවට. විරාම ලකුණු සහ යතුරු ලියනය පිළිබඳ නීති ඉගෙනීම ද නරක අදහසක් නොවේ ... නිදසුනක් වශයෙන්, යම් කාල පරිච්ඡේදයක් පිටතින් නොව සමීප උපුටා දැක්වීමක් තුළට යන බව දැන ගැනීම.
අන්තර්ගත-වර්ගය සහ කේතීකරණය වැනි දෙයක් සඳහා ටැගයක් භාවිතා කිරීම අතිශයින්ම උත්ප්රාසාත්මක ය, මන්ද ඒ දේවල් නොදැන ඔබට මෙටා ටැගයේ වටිනාකම ලබා ගැනීම සඳහා ගොනුව විග්රහ කළ නොහැක.
නැත, එය සත්ය නොවේ. බ්රවුසරය යූටීඑෆ් -8 හෝ අයිඑස්ඕ -8859-1 යන බ්රවුසරයේ පෙරනිමි කේතීකරණය ලෙස ගොනුව විග්රහ කිරීම ආරම්භ කරයි. US-ASCII යනු ISO-8859-1 සහ UTF-8 යන දෙවර්ගයේම උප කුලකයක් බැවින් බ්රව්සරයට ඕනෑම ආකාරයකින් හොඳින් කියවිය හැකිය ... එය එසේම වේ. බ්රව්සරයට මෙටා අක්ෂර ටැගය හමු වූ විට, කේතන ක්රමය බ්රව්සරය දැනටමත් භාවිතා කරන දෙයට වඩා වෙනස් නම්, බ්රව්සරය නිශ්චිත කේතීකරණයේ පිටුව නැවත පූරණය කරයි. හෙඩ් ටැගයට පසුව, වෙනත් ඕනෑම දෙයකට පෙර, මාතෘකාවට පවා ඉහළින් අපි මෙටා චාර්සෙට් ටැගය ඉහළින් තබන්නේ එබැවිනි. එමඟින් ඔබේ මාතෘකාව තුළ UTF-8 අක්ෂර භාවිතා කළ හැකිය.
ඔබ ඔබේ ගොනුව (ගොනු) BOM නොමැතිව UTF-8 කේතීකරණයේ සුරැකිය යුතුය
එය තරයේ සත්ය නොවේ. ඔබේ ලේඛනයේ ඇත්තේ US-ASCII අක්ෂර පමණක් නම්, ඔබට එය US-ASCII ලෙස සුරැකිය හැකි අතර එය UTF-8 ලෙස සේවය කළ හැකිය, මන්ද එය උප කුලකයක් වන බැවිනි. නමුත් යුනිකෝඩ් අක්ෂර තිබේ නම්, ඔබ නිවැරදිය, ඔබ BOM නොමැතිව UTF-8 ලෙස සුරැකිය යුතුය.
ඔබේ ලිපිගොනු UTF-8 තුළ සුරැකිය හැකි හොඳ පෙළ සංස්කාරකයක් ඔබට අවශ්ය නම්, මම නිර්දේශ කරන්නේ Notepad ++.
මැක්හි, මැක් ඇප් වෙළඳසැලෙන් හිස් අස්ථි පෙළ රැන්ග්ලර් (නොමිලේ) හෝ මැක් ඇප් වෙළඳසැලේ ඇති හිස් අස්ථි බීබීඑඩිට් ඩොලර් 39.99 කට භාවිතා කරන්න ... එවැනි විශිෂ්ට මෙවලමක් සඳහා ඉතා ලාභදායී වේ. එක් යෙදුමකදීම, ලේඛන කවුළුවේ පතුලේ මෙනුවක් ඇති අතර එහිදී ඔබ ලේඛන කේතීකරණය නියම කරන අතර ඔබට පහසුවෙන් "UTF-8 no BOM" තෝරා ගත හැකිය. ඇත්ත වශයෙන්ම ඔබට එය මනාපයන්හි නව ලේඛන සඳහා පෙරනිමිය ලෙස සැකසිය හැකිය.
නමුත් ඔබේ වෙබ්සර්වරය නිර්දේශ කරනු ලබන HTTP ශීර්ෂයේ කේතන ක්රමයට සේවය කරන්නේ නම්, [මෙටා ටැග්] දෙකම අනවශ්යය.
එය වැරදිය. ඔබ ඇත්ත වශයෙන්ම HTTP ශීර්ෂය තුළ කේතන ක්රමය සැකසිය යුතුය, නමුත් ඔබ එය මෙටා අක්ෂර කට්ටලයේද සැකසිය යුතුය, එවිට පරිශීලකයාට පිටුව සුරැකිය හැකි අතර, බ්රව්සරයෙන් පිටත දේශීය ගබඩාවට ගොස් පසුව නැවත විවෘත වේ. පවතින කේතීකරණයේ එකම ඇඟවුම මෙටා අක්ෂර කට්ටලයයි. ඔබත් එකම හේතුව නිසා මූලික ටැගයක් සැකසිය යුතුය ... සේවාදායකයේ, මූලික ටැගය අනවශ්යය, නමුත් දේශීය ගබඩාවෙන් විවෘත කළ විට, මූලික ටැගය මඟින් සේවාදායකයේ ඇති ආකාරයට වැඩ කිරීමට පිටුව සක්රීය කරයි. වත්කම් නිසි පරිදි ක්රියාත්මක වන අතර, බිඳුණු සම්බන්ධතා නොමැත.
AddDefaultCharset UTF-8
එසේත් නැතිනම් ඔබට විශේෂිත ගොනු වර්ගවල කේතන ක්රමය වෙනස් කළ හැකිය:
AddType text/html;charset=utf-8 html
UTF-8 සහ ලතින් -1 (ISO-8859-1) යන ගොනු දෙකටම සේවය කිරීම සඳහා වන ඉඟියක් නම් UTF-8 ගොනු "පෙළ" දිගුවක් සහ ලතින් -1 ගොනු "txt" ලබා දීමයි.
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
අවසාන වශයෙන්, ඔබගේ ලේඛන යුනික්ස් රේඛා අවසානයන් සමඟ සුරැකීම ගැන සලකා බලන්න, උරුමය ඩොස් හෝ (සම්භාව්ය) මැක් රේඛා අවසානයන් නොව, උදව් නොකරන හා හානියක් නොවන, විශේෂයෙන් එම උරුම පද්ධති වලින් අප තව දුරටත් ඉදිරියට යන විට රේඛාවෙන් පහළට. වලංගු HTML5, UTF-8 කේතීකරණ සහ යුනික්ස් රේඛා අවසානයන් සහිත HTML ලේඛනයක් හොඳින් කළ කාර්යයකි. ඔබට බොහෝ සන්දර්භය තුළ එම ලේඛනය බෙදා ගැනීමට, සංස්කරණය කිරීමට, ගබඩා කිරීමට, කියවීමට සහ නැවත ලබා ගැනීමට සහ විශ්වාසය තැබිය හැකිය. එය භාෂාමය. එය ඩිජිටල් කඩදාසි ය.