එක්ස්එම්එල් ලේඛනවල ගැලවිය යුතු චරිත මොනවාද, නැතහොත් එවැනි ලැයිස්තුවක් මට සොයාගත හැක්කේ කොතැනින්ද?
එක්ස්එම්එල් ලේඛනවල ගැලවිය යුතු චරිත මොනවාද, නැතහොත් එවැනි ලැයිස්තුවක් මට සොයාගත හැක්කේ කොතැනින්ද?
Answers:
ඔබ සුදුසු පංතියක් හෝ පුස්තකාලයක් භාවිතා කරන්නේ නම්, ඔවුන් ඔබ වෙනුවෙන් පැන යාම සිදු කරනු ඇත. බොහෝ XML ගැටළු ඇති වන්නේ නූල් සම්මුතියෙනි.
ඇත්තේ පහක් පමණි:
" "
' '
< <
> >
& &
අක්ෂර වලින් ගැලවීම විශේෂ චරිතය භාවිතා කරන ස්ථානය මත රඳා පවතී.
උදාහරණ W3C සලකුණු වලංගු කිරීමේ සේවාවෙන් වලංගු කළ හැකිය .
ආරක්ෂිත ක්රමය වන්නේ පෙළ පහේ ඇති අක්ෂර පහෙන් ගැලවීමයි. කෙසේ වෙතත්, අක්ෂර තුන "
, '
සහ >
පෙළෙන් ගැලවීමට අවශ්ය නැත:
<?xml version="1.0"?>
<valid>"'></valid>
ආරක්ෂිත ක්රමය නම් අක්ෂර පහෙන් ගැලවීමයි. කෙසේ වෙතත්, >
චරිතය ලක්ෂණ වලින් ගැලවිය යුතු නැත:
<?xml version="1.0"?>
<valid attribute=">"/>
මෙම '
මේ ආකාරයටම නම් චරිතය අවශ්ය ගුණාංග පලාගියහ කළ නොහැකි "
:
<?xml version="1.0"?>
<valid attribute="'"/>
ඒ හා සමානව, "
උපුටා දැක්වීම් නම්, ගුණාංග වලින් ගැලවිය යුතු නැත '
:
<?xml version="1.0"?>
<valid attribute='"'/>
විශේෂ චරිත පහම අදහස් දැක්වීම් වලින් ගැලවිය යුතු නැත :
<?xml version="1.0"?>
<valid>
<!-- "'<>& -->
</valid>
විශේෂ අක්ෂර පහම CDATA කොටස් වලින් ගැලවිය යුතු නැත :
<?xml version="1.0"?>
<valid>
<![CDATA["'<>&]]>
</valid>
විශේෂ අක්ෂර පහම XML සැකසුම් උපදෙස් වලින් ගැලවිය යුතු නැත :
<?xml version="1.0"?>
<?process <"'&> ?>
<valid/>
HTML සතුව තමන්ගේම ගැලවීමේ කේත කට්ටලයක් ඇති අතර එමඟින් තවත් අක්ෂර රාශියක් ආවරණය වේ.
"
දේ වෙනස් වනු ඇත&quot;
සමහර විට මෙය උපකාරී වනු ඇත:
XML සහ HTML අක්ෂර වස්තු යොමු ලැයිස්තුව:
SGML, HTML සහ XML ලේඛනවල, තාර්කික ව්යුහයන් අක්ෂර දත්ත සහ ආරෝපණ අගයන් ලෙස හැඳින්වේ, අනුක්රමික අනුපිළිවෙලින් සමන්විත වන අතර, එමඟින් සෑම චරිතයක්ම කෙලින්ම විදහා දැක්විය හැකිය (තමා නියෝජනය කරයි), හෝ අක්ෂර මාලාවක් මගින් නිරූපණය කළ හැකිය, ඒවායින් වර්ග දෙකක් ඇත: සංඛ්යාත්මක අක්ෂර යොමු කිරීම සහ අක්ෂර වස්තු යොමු කිරීම. මෙම ලිපියෙන් HTML සහ XML ලේඛන වල වලංගු වන අක්ෂර වස්තු යොමු කිරීම් ලැයිස්තුගත කරයි.
එම ලිපියෙන් පහත දැක්වෙන පූර්ව නිශ්චිත XML ආයතන පහ ලැයිස්තුගත කරයි:
quot "
amp &
apos '
lt <
gt >
ලෝක ව්යාප්ත වෙබ් සම්මේලනයේ (w3C) පිරිවිතරයන්ට අනුව , XML ලේඛනයක ඒවායේ වචනාර්ථයෙන් නොපෙන්විය යුතු අක්ෂර 5 ක් ඇත, ඒවා සලකුණු සලකුණු ලෙස භාවිතා කරන විට හෝ අදහස් දැක්වීමක්, සැකසුම් උපදෙස් හෝ CDATA අංශයක් තුළ හැර . අනෙක් සියලුම අවස්ථාවන්හිදී, පහත දැක්වෙන වගුව අනුව අනුරූප වස්තුව හෝ සංඛ්යාත්මක යොමුව භාවිතා කරමින් මෙම අක්ෂර ප්රතිස්ථාපනය කළ යුතුය:
Original CharacterXML entity replacementXML numeric replacement
< < <
> > >
" " "
& & &
' ' '
& Apos; හැර, ඉහත සඳහන් ආයතන HTML හි ද භාවිතා කළ හැකි බව සලකන්න . , එය XHTML 1.0 සමඟ හඳුන්වා දී ඇති අතර එය HTML 4 හි ප්රකාශයට පත් නොකෙරේ. මේ හේතුව නිසා සහ රෙට්රෝ-ගැළපුම සහතික කිරීම සඳහා, XHTML පිරිවිතර & # 39; වෙනුවට.
>
එය පහත සඳහන් නම් පලා කළ යුතුය ]]
එය කොටසක් විය කිරීම රිසි වෙනවා මිස, අන්තර්ගතය තුළ ]]>
ඇති CDATA කොටස අවසානය දක්වයි බව පරිසීමකය.
ටැග් සහ ගුණාංග සඳහා අක්ෂර ගැලවීම වෙනස් වේ.
ටැග් සඳහා:
< <
> > (only for compatibility, read below)
& &
ගුණාංග සඳහා:
" "
' '
සිට අක්ෂර දත්ත හා සලකුණුබස :
සලකුණු විස්තාරක ලෙස භාවිතා කරන විට හෝ අදහස් දැක්වීමක්, සැකසුම් උපදෙස් හෝ සීඩීඒටීඒ අංශයක් හැර ඇම්පියර්සෑන්ඩ් අක්ෂරය (&) සහ වම් කෝණ වරහන (<) ඒවායේ වචනාර්ථයෙන් නොපෙන්විය යුතුය. ඒවා වෙනත් තැනකට අවශ්ය නම්, සංඛ්යාත්මක අක්ෂර යොමු කිරීම් හෝ පිළිවෙලින් "& amp;" සහ "& lt;" යන නූල් භාවිතා කර ඒවායින් ගැලවිය යුතුය. සෘජු කෝණ වරහන (>) "& gt;" නූල භාවිතා කර නිරූපණය කළ හැකි අතර, අනුකූලතාව සඳහා "& gt;" හෝ අක්ෂර යොමුවකින් එය ගැලවිය යුතුය. CDATA කොටසක අවසානය සලකුණු නොකරන විට.
ආරෝපණ අගයන් තනි සහ ද්විත්ව උපුටා දැක්වීම් දෙකම අඩංගු වීමට ඉඩ දීම සඳහා, අපෝස්තලාපය හෝ තනි-උපුටා දැක්වීමේ අක්ෂරය (') "& apos;" ලෙසද, ද්විත්ව-උපුටා දැක්වීමේ අක්ෂරය (")" & quot; ".
පැරණි, පොදුවේ අසනු ලබන ප්රශ්නයකට නව, සරල පිළිතුරක් ...
සෑම විටම (මතක තබා ගැනීමට 90% වැදගත්)
ගුණාංග අගය (මතක තබා ගැනීමට 9% වැදගත්)
attr="
'
'
ද්විත්ව උපුටා දැක්වීම් තුළ තනි මිල ගණන් හරි."
attr='
"
"
තනි උපුටා දැක්වීම් තුළ ද්විත්ව මිල ගණන් හරි.'
"
ලෙස "
හා '
ලෙස '
වෙනත් ආකාරයකින්.අදහස් , CDATA සහ සැකසුම් උපදෙස් (මතක තබා ගැනීමට 0.9% වැදගත්)
එසෝටෙරිකා (මතක තබා ගැනීමට 0.1% වැදගත්)
]]>
ලෙස ]]>
නම් ]]>
වූ CDATA කොටස අවසන් කර ඇත. ]]>
කළ යුතු තවත් එක් රීතියක්: ]]>
CDATA කොටසක නොමැති විට පවා පැන යා යුතුය . බව සාක්ෂාත් කර ඇති පහසුම ක්රමය විය හැක හැම විටම පැන >
ලෙස >
.
]]>
නමුත් එය >
සැමවිටම ගැලවී යා යුතු යැයි යෝජනා කරනවාට වඩා එය එසෝටෙරිකා වෙත යොමු කිරීමට තෝරාගෙන ඇත (එය ඔබ දන්නා පරිදි විය යුතු නොවේ). මෙහි මගේ ඉලක්කය වන්නේ XML ගැලවීමේ නීති පහසුවෙන් මතක තබා ගැනීම සහ 100% නිවැරදි කිරීමයි.
AttValue
සබැඳියක් ඔස්සේ මගේ පිළිතුර උපුටා දක්වා 2. ලක්ෂණය අගයන් .
පොදුවේ දන්නා අක්ෂර පහට අමතරව [<,>, &, ", සහ '], මම සිරස් ටැබ් අක්ෂරයෙන් (0x0B) ද බේරෙන්නෙමි.එය වලංගු UTF-8, නමුත් වලංගු XML 1.0 නොවේ, සහ බොහෝ පුස්තකාල පවා (ඉතා අතේ ගෙන යා හැකි (ANSI C) පුස්තකාලය libxml2 ඇතුළුව ) එය මඟ හැරී නිහ ly ව අවලංගු XML ප්රතිදානය කරයි.
සංක්ෂිප්ත: XML, පැන යාම
පූර්ව නිශ්චිත ආයතන පහක් ඇත:
< represents "<"
> represents ">"
& represents "&"
' represents '
" represents "
"අවසර ලත් සියලුම යුනිකෝඩ් අක්ෂර සංඛ්යාත්මක අක්ෂර යොමුවකින් නිරූපණය කළ හැකිය." උදාහරණයක් වශයෙන්:
中
බොහෝ පාලන අක්ෂර සහ අනෙකුත් යුනිකෝඩ් පරාසයන් විශේෂයෙන් බැහැර කර ඇත, එයින් අදහස් වන්නේ (මම හිතන්නේ) ඒවා පැන යාමට හෝ සෘජුව සිදුවිය නොහැක:
එය සන්දර්භය මත රඳා පවතී. අන්තර්ගතය සඳහා, එය < සහ & , සහ ]]> (එක් අක්ෂරයක් වෙනුවට තුනකින් යුත් නූලක් වුවද).
ආරෝපණ අගයන් සඳහා, එය < , & , " , සහ ' වේ.
CDATA සඳහා, එය ]]> .
එකම <
හා &
ඔවුන් චරිතය දත්ත ප්රතිකාර කිරීමට නම් කළ හා සලකුණු නොවේ පලා කළ යුතු වේ:
<company>AT&T</company>