පෙළෙහි කේතය විශ්වාසදායක ලෙස හඳුනා ගැනීම සඳහා සරල ක්‍රමයක්?


144

GMail හි මෙම අංගය ඇත, එහිදී ඔබ ඇමුණුමක් ඇතැයි සිතන ඊ-තැපෑලක් යැවීමට උත්සාහ කළහොත් එය ඔබට අනතුරු අඟවයි .

ලිපිගොනු ඇමිණීමට ඔබ අදහස් කළාද?

GMail see the attachedවිද්‍යුත් තැපෑලෙහි ඇති නූල හඳුනාගත් නමුත් සත්‍ය ඇමුණුමක් නොමැති නිසා, මම යවන්න බොත්තම ක්ලික් කළ විට එය හරි / අවලංගු කිරීමේ සංවාදයකින් අනතුරු අඟවයි.

Stack Overflow සම්බන්ධයෙන් අපට අදාළ ගැටළුවක් ඇත. එනම්, පරිශීලකයෙකු මෙවැනි තනතුරකට ඇතුළු වූ විට :

මගේ ගැටලුව නම් මට දත්ත සමුදාය වෙනස් කළ යුතු නමුත් මම නිර්මාණය නොකරමි 
නව සම්බන්ධතාවයක්. උදාහරණයක්:

DataSet dsMasterInfo = නව DataSet ();
දත්ත සමුදාය db = DatabaseFactory.CreateDatabase ("ConnectionString");
DbCommand dbCommand = db.GetStoredProcCommand ("uspGetMasterName");

මෙම පරිශීලකයා ඔවුන්ගේ කේතය කේතයක් ලෙස සංයුති කර නැත !

එනම්, ඔවුන් මාර්ක්ඩවුන් සඳහා අවකාශ 4 කින් ඇතුල් කළේ නැත, නැතහොත් කේත බොත්තම (හෝ යතුරුපුවරු කෙටිමං ctrl+ k) භාවිතා කළේ නැත.

මේ අනුව, අපගේ පද්ධතිය මඟින් මිනිසුන්ට ඇතුළු විය යුතු සංස්කරණ රාශියක් පිළිගෙන ඇති අතර මෙය කෙසේ හෝ හඳුනාගත නොහැකි පුද්ගලයින් සඳහා කේතයක් අතින් සකස් කරයි. මෙය බඩේ අමාරුවකට මග පාදයි . අපි කිහිප වතාවක්ම සංස්කාරක උදව් වැඩි දියුණු කර ඇත්තෙමු, නමුත් පරිශීලකයාගේ නිවසට රිය පැදවීම සහ ඔවුන්ගේ යතුරුපුවරුවේ නිවැරදි බොත්තම් එබීම කෙටි නිසා, ඊළඟට කුමක් කළ යුතු දැයි බැලීමට අපට නොහැකි වී ඇත.

ගූගල් GMail විලාසිතාවේ අනතුරු ඇඟවීමක් අප සලකා බලන්නේ එබැවිනි.

ඔබ අදහස් කළේ කේතය පළ කිරීමටද?

ඔබ කේත ලෙස පෙනේ යැයි සිතන දේවල් ඔබ ලියා ඇත, නමුත් මෙවලම් තීරු කේත බොත්තම හෝ ctrl+ kකේත ආකෘතිකරණ විධානය භාවිතා කරමින් අවකාශ 4 ක් ඇතුලත් කිරීමෙන් ඔබ එය කේතයක් ලෙස සංයුති කර නැත .

කෙසේ වෙතත්, මෙම අනතුරු ඇඟවීම ඉදිරිපත් කිරීම මඟින් ප්‍රශ්නයක් තුළ ආකෘතිගත නොකළ කේතයක් ලෙස අප සිතන දේ හඳුනා ගැනීමට අවශ්‍ය වේ . මෙය සිදු කිරීම සඳහා සරල, අර්ධ විශ්වසනීය ක්‍රමයක් කුමක්ද?

  • එක් Markdown , කේතය සැමවිටම හිස් තැන් 4 හෝ backticks තුළ indented ඇත, එසේ නිවැරදිව ෆෝමැට් කිසිවක් වහාම පරීක්ෂා බැහැර කළ හැකිය.
  • මෙය අනතුරු ඇඟවීමක් පමණක් වන අතර එය අදාළ වන්නේ අඩු කීර්තියක් ඇති පරිශීලකයින්ට ඔවුන්ගේ පළමු ප්‍රශ්න අසන විට (හෝ ඔවුන්ගේ පළමු පිළිතුරු සැපයීම) පමණි, එබැවින් සමහර ව්‍යාජ ධනාත්මක කරුණු 5% හෝ ඊට අඩු වන තාක් කල් හරි ය.
  • අපගේ චෙක්පත යථාර්ථවාදීව "ලොකු දහය" භාෂාවන්ට පමණක් සීමා කළ හැකි වුවද, තොග පිටාර ගැලීම පිළිබඳ ප්‍රශ්න ඕනෑම භාෂාවකින් විය හැකිය. ටැග් පිටුවට C #, Java, PHP, JavaScript, Objective-C, C, C ++, Python, Ruby.
  • ඔබේ විභව විසඳුම විගණනය කිරීම සඳහා ස්ටැක් පිටාර ගැලීම් නිර්මාණාත්මක කොමන්ස් දත්ත ඩම්ප් භාවිතා කරන්න (නැතහොත් ස්ටැක් පිටාර ගැලීම් පිළිබඳ ඉහළම ටැග් 10 හි ප්‍රශ්න කිහිපයක් තෝරා ගන්න ) සහ එය කරන්නේ කෙසේදැයි බලන්න.
  • ව්‍යාජ කේතය හොඳයි, නමුත් ඔබට අමතර මිත්‍රශීලී වීමට අවශ්‍ය නම් අපි c # භාවිතා කරමු.
  • වඩා සරල වඩා හොඳ (එය ක්‍රියාත්මක වන තාක් කල්). හාදුවක්! ඔබේ විසඳුමට අපට විවිධ සම්පාදකයින් 10 දෙනෙකුගේ ලිපි සම්පාදනය කිරීමට උත්සාහ කළ යුතු නම් හෝ බේසියානු අනුමාන එන්ජිමක් අතින් පුහුණු කිරීම සඳහා මිනිසුන්ගේ හමුදාවක් අවශ්‍ය නම්, එය ... අපගේ මනසේ තිබුනේ හරියටම නොවේ.

34
ඉන්ඩෙන්ටේෂන් නොමැති නම් ඔබ සැමවිටම අනතුරු ඇඟවීම පෙන්වන්නේ නම්, ඔබ 5% දෝෂ සීමාවට වඩා අඩු වනු ඇත. මෙය විහිළුවක් ලෙස අදහස් කරන්නේ අඩක් පමණි.
කොන්රාඩ් රුඩොල්ෆ්

59
On කොන්රාඩ් පණිවිඩය නම් මෙය වඩාත් හොඳ වනු ඇත: 'එක්කෝ ඔබේ ප්‍රශ්නයට කේත සාම්පල අස්ථානගත වී ඇති අතර එය අන් අයට තේරුම් ගැනීමට උපකාරී වේ, නැතහොත් ඒවා නිසි ලෙස ඇතුල් කිරීමට ඔබට අමතක විය'. මෙය සියලුම සිද්ධීන්ගෙන් 99% ක් ආවරණය කළ යුතුය.
thorsten müller

3
මෙය හොඳ ප්‍රශ්නයක් නමුත් එයට පිළිතුරක් නොමැති බව මට හැඟේ. ඔබ මට මෝඩ-ඔප්පු කිරීමේ පද්ධතියක් පෙන්වන අතර මම ඔබට වඩා හොඳ මෝඩයෙක් පෙන්වන්නම්. මෙම ගැටළුව CODE මගින් විසඳිය හැකි වුවද, සමහර විට එසේ නොවිය යුතුද? මා වැනි අය සඳහා නිසි ප්‍රශ්න අසන සහ නිසි පිළිතුරු සපයන IMHO සඳහා මෙම වෙබ් අඩවිය මෙහෙයවන හොඳ ප්‍රශ්නයක් ඇසීමට කරදර විය නොහැකි මෙම නූගත් අයයි.
maple_shaft

2
මා දුටු පොදු රටාවක් වන්නේ කේතයක් නිසි ලෙස ඇතුලත් කර ඇති නමුත් පළමු හා අවසාන පේළි (සාමාන්‍යයෙන් එම දෙක පමණක්, සමහර විට බහු කාර්යයන් පෙන්වන විට වැඩි ගණනක්) කේත ලෙස ලේබල් නොකෙරේ. මෙය බොහෝ විට හඳුනාගත යුතුය.
3Doubloons

3
පැති සටහනක, GMail තහවුරු කිරීමේ පෙළ තරමක් අවුල් සහගත ය. පළමු ප්‍රශ්නයට ඔබේ පිළිතුර 'ඔව්' නම් දෙවන ප්‍රශ්නයට පිළිතුර 'නැත' යන්නයි ...
pimvdb

Answers:


148

නිසි විසඳුමක් බොහෝ උගත් / සංඛ්‍යානමය ආකෘතියක් වනු ඇත, නමුත් මෙන්න විනෝදජනක අදහස් කිහිපයක්:

  1. රේඛාවක් අවසානයේ අර්ධ කොලෝන් . මෙය පමණක් මුළු භාෂා පොකුරක් අල්ලා ගනු ඇත.
  2. වරහන් වර්‍ග සෘජුවම පහත දැක්වෙන පෙළ වෙන් කිරීමට ඉඩක් නොමැතිව: myFunc()
  3. වචන දෙකක් අතර තිතක් හෝ ඊතලයක්: foo.bar = ptr->val
  4. කැරලි වරහන්, වරහන් තිබීම: while (true) { bar[i]; }
  5. "අදහස්" සින්ටැක්ස් (/ *, //, ආදිය) තිබීම: /* multi-line comment */
  6. අසාමාන්‍ය චරිත / ක්‍රියාකරුවන්: +, *, &, &&, |, ||, <, >, ==, !=, >=, <=, >>, <<, ::, __
  7. ඔබේ සින්ටැක්ස් හයිලයිටරය පෙළ මත ධාවනය කරන්න. එය එහි ඉහළ ප්‍රතිශතයක් ඉස්මතු කිරීම අවසන් කරන්නේ නම්, එය බොහෝ විට කේතය වේ.
  8. තනතුරේ camelCase පෙළ.
  9. කැදැලි වරහන්, වරහන් සහ / හෝ වරහන්.

එක් වරක් මෙම දර්ශණය එක් එක් සංඛ්යාව පිළිබඳ වාර්තාවක් තබා හැකි, සහ මේ වගේ යන්ත්රයක්-ඉගෙන ඇල්ගොරිතමය විශේෂාංග ලෙස යොදා ගත හැකි perceptron , SpamAssassin කරන්නේ මාර්ගය.


25
ඉඟි: 3 ඉතා අඩු බරක් ඇත, මන්ද වචන අතර තිතක් යතුරු ලියනයක ප්‍රති result ලයක් විය හැකිය. 5 URL සමඟ නොගැලපේ. 6 සඳහා ඇම්පර්සෑන්ඩ් නිතර භාවිතා වන්නේ කේත සන්දර්භයෙන් පිටත ය. නොට්පෑඩ් ++ හි සමහර විට මා දකින පරිදි කේත නොවන පෙළ ඉස්මතු කළ හැකි නිසා හයිලයිටරය ක්‍රියා කරන්නේ දැයි දෙවරක් පරීක්ෂා කරන්න.
තමරා විජ්මන්

8
නැවත. යතුරු ලියනය ලෙස - කතුවරයා කෙසේ හෝ සංස්කරණය කළ යුතු බැවින් සලකුණු කිරීමේදී කිසිදු හානියක් සිදු නොවේ.
user151019

4
ඊට අමතරව, බොහෝ භාෂාවන්ට ඇති විශේෂිත වචන උපකාර කළ හැකිය: WHILE, ELSE, IF, LOOP, BREAK, ආදිය
ජොසේනූෆෙරෙයිරා

6
"සංඛ්‍යාත්මක නොවන වචන වලට පෙර of භාවිතය: එකතු කරන්න Per පර්ල් සහ පීඑච්පී (සහ රූබි?) වල පොදු වේ."
ෆිල්හෝ

4
ඔබ මගේ හඳුනා නොගනී SELECT DISTINCT name FROM people WHERE id IS NOT NULL.
බෙනොයිට්

54

එක් පැත්තකින් ලිඛිත ඉංග්‍රීසි වල සාමාන්‍ය ප්‍රමිතික මොනවාද සහ අනෙක් පැත්තෙන් කේත මොනවාදැයි බැලීමට මට කුතුහලයක් ඇත.

  • ඡේදවල දිග
  • රේඛා වල දිග
  • වචන ප්‍රමාණය
  • භාවිතා කරන අක්ෂර
  • අකාරාදී, සංඛ්‍යාත්මක සහ වෙනත් සංකේත අක්ෂර අතර අනුපාතය
  • වචනයකට සංකේත ගණන
  • ආදිය.

සමහර විට එය පමණක් කේතය සහ අනෙක් ඒවා අතර වෙනස්කම් කිරීමට ඉඩ ඇත. අවම වශයෙන් මම විශ්වාස කරන්නේ කේතය, භාෂාව කුමක් වුවත්, බොහෝ අවස්ථාවන්හි සැලකිය යුතු ලෙස වෙනස් ප්‍රමිතික පෙන්වනු ඇති බවයි.

ශුභාරංචිය නම්: ඔබේ සංඛ්‍යාලේඛන ගොඩනගා ගැනීම සඳහා ඔබට දැනටමත් ඕනෑ තරම් දත්ත තිබේ.


හරි, මම මගේ උපකල්පන උපස්ථ කිරීමට දත්ත කිහිපයක් සමඟ ආපසු ආවෙමි. :-)

මම ඔබේම පෝස්ට් එකක ඉක්මන් හා අපිරිසිදු පරීක්ෂණයක් කළෙමි. ස්ටැක් ඕවර්ෆ්ලෝ හි මා දුටු පළමු පෝස්ට් එකෙහි ඉතා දියුණු මෙවලමක් ඇත : wc.

මෙන්න wcමෙම උදාහරණ දෙකේ පෙළ කොටස සහ කේත කොටස ධාවනය කිරීමෙන් පසු මා සතුව තිබූ දේ :

පළමුව ඉංග්‍රීසි කොටස දෙස බලමු :

  • ඔබගේ ලිපියේ ඉංග්‍රීසි කොටස (අක්ෂර 2635, වචන 468, පේළි 32)
    • අක්ෂර 5 / වචනය, අක්ෂර 82 / පේළිය, වචන 14 / පේළිය
  • අනෙක් තනතුරේ ඉංග්‍රීසි කොටස (අක්ෂර 1499, වචන 237, පේළි 12)
    • අක්ෂර 6 / වචනය, අක්ෂර 124 / පේළිය, වචන 19 / පේළිය

තරමක් සමාන ඔබ සිතන්නේ නැද්ද?

දැන් කේත කොටස දෙස බලමු !

  • ඔබගේ ලිපියේ කේත කොටස (අක්ෂර 174, වචන 13, පේළි 3)
    • අක්ෂර 13 ක් / වචනයක්, අක්ෂර 58 ක් / පේළියක්, වචන 4 ක් / පේළියක්
  • අනෙක් තනතුරේ කේත කොටස (අක්ෂර 4181, වචන 287, පේළි 151)
    • අක්ෂර 14 / වචනය, අක්ෂර 27 / පේළිය, වචන 2 / පේළිය

බලන්න එම ප්‍රමිතික එතරම් වෙනස් නොවන නමුත් වඩා වැදගත් වන්නේ ඒවා ඉංග්‍රීසි ප්‍රමිතිකවලට වඩා කොතරම් වෙනස්ද? මෙය හුදෙක් සීමිත මෙවලමක් භාවිතා කිරීමකි. වැඩි ප්‍රමිතික මැනීමෙන් ඔබට නිවැරදි යමක් ලබා ගත හැකි බව මට දැන් විශ්වාසයි (මම විශේෂයෙන් අක්ෂර සංඛ්‍යා ලේඛන ගැන සිතමි).

මට කුකී හැස් කරන්න පුළුවන්ද?


6
රේඛීය දිග, විශේෂයෙන් ඔබ වෙඩි උණ්ඩ ලකුණු බැහැර කර නිශ්චිත විරාම ලකුණු අඩංගු නිශ්චිත දිගකට වඩා අඩු පොකුරු රේඛා සොයන්නේ නම් එය හොඳ මිනුමක් ලෙස පෙනේ.
ජෝන් හොප්කින්ස්

මෙය කේත කොටස් සඳහා වැඩ කරනු ඇත, නමුත් පේළිගත සීඩී තැටියක් සෙවීම දුෂ්කර බව පෙනේ. එය කොතරම් වැදගත්දැයි විශ්වාස නැත, නමුත් - විශාල ගැටළුව වන්නේ කෙසේ වෙතත් ආකෘතිගත නොකළ කේත විශාල කොටස් ය.
cHao

3
කුකීස් නැත. ඔබගේ ලිපියේ සබැඳිය 404.
james.garriss

@ james.garriss: අන්තර්ජාලය මගේ කුකී බඳුන සොරකම් කළේය. :( දැනුම්දීම සඳහා ස්තූතියි.
ජූලියන් ගුවර්ටෝල්ට්

23

සාමාන්‍යයෙන්, පෙළ ජනනය කිරීම සඳහා මාකෝව් දම්වැල් භාවිතා කරනු ලැබේ, නමුත් ඒවා පුහුණු ආකෘතියකට ( CE ෂැනන් 1950 ට අනුව ) පෙළෙහි සමානකම පුරෝකථනය කිරීමට ද භාවිතා කළ හැකිය . මාකෝව් දාම කිහිපයක් නිර්දේශ කරමි.

පවත්නා සෑම භාෂාවක් සඳහාම, භාෂාවේ විශාල කේත නියැදියක් මත මාකෝව් දාමයක් පුහුණු කරන්න. ඔබට කේතය හඳුනා ගැනීමට අවශ්‍ය ස්ටැක් පිටාර ගැලීමේ තනතුරක් සඳහා, එක් එක් දාම සඳහා පහත සඳහන් දේ කරන්න:

  • පෝස්ට් එකේ රේඛා හරහා ලූප් කරන්න.
    • විචල්යයන් දෙකක් ප්රකාශ කරන්න: ACTUAL = 1.0 සහ HIGHEST = 1.0
    • පේළියේ එක් එක් අක්ෂර හරහා ලූප.
      • එක් එක් අක්ෂර සඳහා, මාකෝව් දාමයේ ඇති සම්භාවිතාව සොයා ගන්න, වර්තමාන අක්‍ෂරය පෙර එන් අක්ෂර අනුගමනය කරයි. ACTUAL = ACTUAL * PROB 1 සකසන්න . දාමයේ වත්මන් අක්‍ෂරය නොමැති නම්, 0.000001 වැනි PROB 1 සඳහා ඉතා කුඩා අගයක් භාවිතා කරන්න .
      • දැන්, පෙර N අක්ෂර අනුගමනය කිරීමට බොහෝ දුරට ඉඩ ඇති (එනම් ඉහළම සම්භාවිතාව) සොයා ගන්න. HIGHEST = HIGHEST * PROB 2 සකසන්න .
      • නිසැකවම, PROB 2 > = PROB 1

සෑම පේළියක් සඳහාම, ඔබට නියම සහ ඉහළම අගයක් තිබිය යුතුය. ඉහළම මට්ටමෙන් ACTUAL බෙදන්න. එමඟින් යම් රේඛාවක් ප්‍රභව කේතයක්ද යන්න පිළිබඳව යෝග්‍යතා ලකුණු ලබා දෙනු ඇත. එය ඔබ දුන් උදාහරණයේ එක් එක් පේළි සමඟ සංඛ්‍යාවක් සම්බන්ධ කරයි:

my problem is I need to change the database but I don't won't to create // 0.0032
a new connection. example: // 0.0023

DataSet dsMasterInfo = new DataSet(); // 0.04
Database db = DatabaseFactory.CreateDatabase("ConnectionString");   // 0.05
DbCommand dbCommand = db.GetStoredProcCommand("uspGetMasterName");  // 0.04

අවසාන වශයෙන්, තනතුරේ කේතයක් ඇති විට තීරණය කිරීම සඳහා ඔබ එළිපත්තක් තෝරා ගත යුතුය. මෙය හුදෙක් ඉහළ කාර්ය සාධනයක් ලබා දෙන නිරීක්ෂණ මගින් තෝරාගත් අංකයක් විය හැකිය. ඉහළ ලකුණු සහිත පේළි ගණන ද එයට සැලකිල්ලට ගත හැකිය.

පුහුණුව

පුහුණු කිරීම සඳහා, භාෂාවෙන් විශාල, නියැදි කේත සාම්පලයක් ලබා ගන්න. කේත පා over ය හරහා ලූප් කිරීමට වැඩසටහනක් ලියන්න සහ ගොනුවේ එක් එක් එන්-ග්‍රෑම් (N සඳහා පරාසය පරාමිතිකරණය කළ යුතුය) පසු අක්ෂරවල සංඛ්‍යාන සංඛ්‍යාතය සමඟ සම්බන්ධ කරන්න. මෙය සම්භාවිතාව සමඟ සම්බන්ධ වී ඇති බිග්‍රෑම් අනුගමනය කරන අක්‍ෂරවල විවිධ තත්වයන් ලබා දෙනු ඇත. උදාහරණයක් ලෙස, බිග්‍රෑම් "()" හි පහත දැක්වෙන අනුලකුණු සම්භාවිතාවන් තිබිය හැකිය:

"()" 0.5-> ";"
"()" 0.2-> "."
"()" 0.3-> "{"

පළමුවැන්න කියවිය යුතුය, උදාහරණයක් ලෙස "අර්ධ වර්‍ගයක් හිස් වර්‍ගයක් අනුගමනය කිරීමේ සම්භාවිතාව 0.5 කි."

පුහුණුව සඳහා, දෙකේ සිට පහ දක්වා ප්‍රමාණයේ එන්-ග්‍රෑම් නිර්දේශ කරමි. මම මේ පිළිබඳව යම් පර්යේෂණයක් කළ විට අපට පෙනී ගියේ එන්-ග්‍රෑම් දෙකේ සිට පහ දක්වා ප්‍රමාණය ඉංග්‍රීසි සඳහා හොඳින් ක්‍රියාත්මක වන බවයි. ප්‍රභව කේත බොහොමයක් ඉංග්‍රීසි වැනි බැවින්, මම යෝජනා කරන්නේ එම පරාසය සමඟ ආරම්භ කර ඔබ ක්‍රියා කරන දේ සොයා ගන්නා විට ප්‍රශස්ත පරාමිති අගයන් සොයා ගැනීමට සකස් කරන්න.

අවවාදයක්: හඳුනාගැනීම්, ක්‍රම නාම, සුදු අවකාශය යනාදිය මෙම ආකෘතියට බලපානු ඇත. කෙසේ වෙතත්, පුහුණු නියැදියේ ඇතැම් අංග මඟ හැරීම සඳහා ඔබට පුහුණුව සුසර කළ හැකිය. උදාහරණයක් ලෙස, ඔබට සියලු අනවශ්‍ය හිස් අවකාශය බිඳ දැමිය හැකිය. ආදානයේ සුදු පැහැති අවකාශය තිබීම (Stack Overflow post) ද නොසලකා හැරිය හැකිය. ඔබට අකාරාදී නඩුව නොසලකා හැරිය හැකිය, එය විවිධ හඳුනාගැනීමේ නම් කිරීමේ සම්මුතීන් හමුවේ වඩාත් ඔරොත්තු දීමේ හැකියාව ඇත.

මගේ පර්යේෂණ අතරතුර , අපගේ ක්‍රම ස්පා Spanish ් for සහ ඉංග්‍රීසි සඳහා හොඳින් ක්‍රියාත්මක වන බව අපට පෙනී ගියේය. මෙය ප්‍රභව කේත සඳහාද හොඳින් ක්‍රියා නොකරන්නේ මන්දැයි මම නොදනිමි. ප්‍රභව කේතය මිනිස් භාෂාවට වඩා ව්‍යුහාත්මක හා පුරෝකථනය කළ හැකිය.


2
මා පුරෝකථනය කළ එකම ගැටළුව වන්නේ ඔබේ සෙල්ලම් උදාහරණයට වඩා සම්භාවිතාව ඉතා කුඩා වීමයි. සංඛ්‍යාත්මක අස්ථායීතාවය අනුව, මෙයින් අදහස් කරන්නේ ඉතා ඉක්මනින් සියලු සම්භාවිතාවන් 0 ක් වනු ඇති බවයි. තවද, මම විශාල ටෝකන භාවිතා කරමි (එනම් අක්ෂර නොව වචන / විරාම ලකුණු).
කොන්රාඩ් රුඩොල්ෆ්

2
On කොන්රාඩ්: මෙහි අදහස නිරපේක්ෂ සම්භාවිතාවන් පරීක්ෂා කිරීම නොවේ: එය සාපේක්ෂ සම්භාවිතාවන් පරීක්ෂා කිරීමයි. එක් එක් පේළිය සඳහා, එම රේඛාවේ පෙළ ඉංග්‍රීසි භාෂා ආකෘතියක් හෝ කේත භාෂා ආකෘතියක් මගින් ජනනය කර ඇති බව පෙනේ.
කෙන් බ්ලූම්

5
ඔබට දැනට පවතින SO පෝස්ට් වල මෙම ආකෘතිය පුහුණු කළ හැකිය (විශේෂයෙන් ඔබට මාර්ක්ඩවුන් සින්ටැක්ස් සඳහා ගිණුම් කිරීමට අවශ්‍ය විය හැකිය). බොහෝ තනතුරු නිවැරදිව සංයුති කර ඇති බව ඔබ උපකල්පනය කරන්නේ නම් (හෝ ඔබ දස දහස් ගණනක අනුපිළිවෙල අනුව, නිවැරදිව ආකෘතිකරණය නොකරන ලද තනතුරු ඉවත් කිරීමට) , සහ කේත හැඩතල ගැන්වූ දේවල් කේතය, ඔබට සත්‍ය SO පිළිතුරු වලින් පුහුණු කළ හැකිය.
කෙන් බ්ලූම්

1
මෙය කරන්නේ කෙසේද යන්න පිළිබඳ නිබන්ධනයක් (ජාවා හි LingPipe භාවිතා කිරීම) LingPipe හි වෙබ් අඩවියෙන් ලබා ගත හැකිය . නිබන්ධනය අවසානයේ, මෙම ගැටළුව විසඳීම සඳහා ශිල්පීය ක්‍රම පිළිබඳ ලිපි ගණනාවක් තිබේ. ඒවා කියවීමට මම යෝජනා කරමි.
කෙන් බ්ලූම්

1
නවීන විසඳුමේ තත්වය ඉතා අඩු ඡන්ද සංඛ්‍යාවක් පමණක් ඇති බව දැකීම සිත්ගන්නා කරුණකි. එම සියලු තාවකාලික විසඳුම් වලට වඩා අනුපාත ඉතා අඩුය, පිළිගත හැකි තරම් හොඳ විය හැකි නමුත් විශේෂ ආවරණයක් මත රඳා පවතින සහ සහජයෙන්ම අධික ලෙස ආහාර ගැනීමේ හැකියාව ඇත.
කොන්රාඩ් රුඩොල්ෆ්

13

රැඩිකල් ලෙස වෙනස් ප්‍රවේශයක් මට යෝජනා කළ හැකිද? SO හි අවසර දී ඇති එකම මානව භාෂාව ඉංග්‍රීසි ය, එබැවින් ඉංග්‍රීසි නොවන ඕනෑම දෙයකට කේත ස්නිපටයක් වීමට 99.9% ක ඉඩක් ඇත .

එබැවින් මගේ විසඳුම වනුයේ: එහි ඇති බොහෝ ඉංග්‍රීසි භාෂා පරීක්‍ෂකයන්ගෙන් එකක් භාවිතා කරන්න (අක්ෂර වින්‍යාසයන්ට අමතරව - ද්විත්ව තිත් වැනි වාක්‍ය ඛණ්ඩ වැරදි හෝ භාෂා නොවන සංකේත වැනි #හෝ සං signal ා කරන බවට වග බලා ගන්න ~). එවිට දෝෂ සහ අනතුරු ඇඟවීම් විශාල ප්‍රමාණයක් විසි කරන ඕනෑම පේළියක් / ඡේදයක් "මෙම කේතයද?" ප්‍රශ්නය.

ඇත්ත වශයෙන්ම ඉංග්‍රීසි හැර වෙනත් භාෂා භාවිතා කරන එම ස්ටැක්එක්ස්චේන්ජ් වෙබ් අඩවි සඳහාද මෙම ප්‍රවේශය අනුවර්තනය කළ හැකිය.

මගේ 2 ¢ ...


16
ගැටළුව වන්නේ එන ප්‍රශ්න බොහොමයක් ඉංග්‍රීසි නොවීමයි (ඒවා සමාන වුවත්).
බ්‍රෙන්ඩන් ලෝන්ග්

3
Re බ්‍රෙන්ඩන් - එවිට මෙම යෝජනාවේ වාසියක් එක් කරන ලදි: බොහෝ විට අපේක්‍ෂා කිරීමට අදහස් කර ඇති ඉංග්‍රීසි කොටස්වල ඇති වැරදි අවධාරණය කරන්න (හෝ ඉස්මතු කරන්න) සහ ලේඛකයාට ලිවීමට උදව් කරන්න ... ඉංග්‍රීසියෙන්! ;)
මැක්

1
මම ලන්දේසි ජාතිකයෙක් වන අතර මා කේත කරන සෑම දෙයක්ම ඉංග්‍රීසියෙන් ඇත, අදහස් දැක්වීමෙන් නොවේ (ව්‍යාපෘතිය අනුව). එබැවින් ඉංග්‍රීසි නොවන කේත ප්‍රමාණවත් නොවිය යුතුය. එය හෝ ඔබ අදහස් කරන්නේ බිඳුණු ඉංග්‍රීසි කේත විය යුතු බවයි.
අයිවෝ ලිමන්

V අයිවෝ - මගේ ප්‍රකාශය බිඳුණු ඉංග්‍රීසි ප්‍රශ්නයට විහිළුවක් ලෙස ආමන්ත්‍රණය කරන ලදි! ;) කෙසේ වෙතත් මම කියන්නේ මගේ යෝජනාව සමඟ වෙනත් භාෂාවකින් අදහස් දැක්වීම හොඳ වනු ඇති බවයි ... OTOH බ්ලොක් අදහස් ඉංග්‍රීසියෙන් "මෙය කේතයද?" ප්‍රශ්නය, නමුත් එය හොඳයි, මන්ද එම අදහස ලියා ඇති කේතය දැනටමත් එය අවුලුවනු ඇත ...
mac

11

මම බොහෝ විට මේ සඳහා අඩු ඡන්ද කිහිපයක් ලබා ගැනීමට යන නමුත් මම හිතන්නේ ඔබ මෙය ළඟා වන්නේ වැරදි කෝණයකිනි.

මෙම රේඛාව මට ලැබුණි:

මෙය කෙසේ හෝ හඳුනාගත නොහැකි පුද්ගලයින් සඳහා මිනිසුන්ට ඇතුළට ගොස් කේතයක් අතින් සකස් කළ යුතුය

IMO එම ස්ථාවරය අහංකාරය. මෘදුකාංග සැලසුම් කිරීමේදී මම මෙය බොහෝ සෙයින් සොයාගන්නේ මෘදුකාංගය නිසි ලෙස භාවිතා කරන්නේ කෙසේදැයි සිතාගත නොහැකි පරිශීලකයින් සමඟ ක්‍රමලේඛකයින් සහ නිර්මාණකරුවන් කෝපයට පත්වන අතර, ගැටලුව පරිශීලකයා නොව මෘදුකාංගය හෝ අවම වශයෙන් UI ය.

මෙම ගැටළුවට මූලික හේතුව පරිශීලකයා නොව ඔවුන්ට මෙය කළ හැකි බව ඔවුන්ට නොපෙනේ.

මෙය වඩාත් පැහැදිලිව දැක්වීම සඳහා UI හි වෙනසක් කරන්නේ කෙසේද? නිසැකවම මෙය වනු ඇත:

  1. නව පරිශීලකයින්ට ඔවුන් කළ යුතු දේ හරියටම පැහැදිලිව පෙනේ
  2. භාෂා රාශියක කේත තර්කනය හඳුනා ගැනීම සඳහා සංකීර්ණ ඇල්ගොරිතම ලිවීමට වඩා ඔබට ගොඩනගා ගැනීම පහසුය

උදාහරණයක්:

රූප විස්තරය මෙහි ඇතුළත් කරන්න


26
ඇත්ත වශයෙන්ම මෙම IMO විසින් "මට ගැටලුවක් තිබේ, කරුණාකර මට උදව් කරන්න, කේතය පහතින් ඇත" වැනි දුර්වල ප්‍රශ්න බලාත්මක කරයි - ඉතා කලාතුරකින් කේතය ප්‍රශ්නයෙන් වෙන් කළ යුතුය. හොඳම ප්‍රශ්න මේ ආකාරයට ය "මට මෙය සාක්ෂාත් කර ගැනීමට අවශ්‍ය වන අතර මෙම කේත පේළි දෙක ලිවීය, නමුත් බලපෑම පහත දැක්වේ, ගැටලුව කුමක්ද" - සරල භාෂාවෙන් දැඩි ලෙස අන්තර් සම්බන්ධිත කේත ඉතා අල්පය.
ෂාප්ටූත්

4
ඔබේ root නිරීක්ෂණ නිවැරදි වන නමුත් ඔබේ රෝග විනිශ්චය තවමත් වැරදි: ඇත්ත, ජෙෆ් ඇත මෙම ප්රවේශය හරහා පරිශීලක අතුරු මුහුණත වැඩි දියුණු කිරීම සඳහා උත්සාහ. තවද, වර්තමාන UI දැනටමත් චක්‍ර කිහිපයක් හරහා ගොස් ඇති අතර එය වැඩිදියුණු කළ හැකි බවට මා සැක නොකරන අතර (දැඩි ලෙස), මෙය කම්මැලි මෝඩයන්ට එරෙහිව උපකාරී වනු ඇතැයි මම සැක කරමි. ඔබේ යෝජිත විසඳුම ද නොවේ. ෂාර්ප්ටූත් මෙය ආවරණය කර ඇත.
කොන්රාඩ් රුඩොල්ෆ්

2
කොටුව ගැන සිතීම සඳහා මම +1 කරන්නෙමි, නමුත් නිශ්චිත යෝජනාවට මම එකඟ නොවෙමි, මන්ද “ආධාරක කේතය” පළ කිරීම අස්වාභාවික විය හැකි ප්‍රශ්න ප්‍රවාහයකට බල කරයි. මගේ ප්‍රශ්නයේ පතුලේ මම කිසි විටෙක කේතයට දමා නැත. මම සෑම විටම පාහේ හැඳින්වීමක්, නියැදි කේතය, පසුව සත්‍ය ප්‍රශ්නය පළ කරමි. පේළිගත කිරීමේ කේතය අත්‍යවශ්‍ය යැයි ඔබ මෙම මතය පිළිගන්නේ නම්, යම් ආකාරයක හැඩතල ගැන්වීමක් අවශ්‍ය වේ - ආකෘතිකරණය පරිශීලකයා විසින් ඇතුළත් කළ යුතු හෝ පද්ධතිය විසින් නිර්දේශ කළ යුතුය. ජෙෆ් ඉල්ලන්නේ හරියටම එයයි.
නිකොල්

1
On කොන්රාඩ්: මගේ ඉහත අදහස් දැක්වීමට අමතරව සහ ඔබේ ප්‍රතිචාරයට අමතරව, ජෙෆ් මෙම මාවත අනුගමනය කරමින් යූඅයි වැඩිදියුණු කරන බව මම විශ්වාස නොකරමි, නමුත් හුදෙක් යටින් පවතින ගැටලුවක රෝග ලක්ෂණ වලට ප්‍රතිකාර කිරීම. වැරැද්ද කළ නොහැකි වන පරිදි UI වැඩි දියුණු කර ඇත්නම්, එවිට පරිශීලකයා දැනුවත් කිරීමේ විසඳුම අවශ්‍ය නොවේ. මගේ ආදර්ශය අවසාන විසඳුම බව මට කිසිදු මිත්‍යාවක් නැත, නමුත් සමහර සිතුවිලි "අප මෙය ඉදිරිපත් කරන්නේ හැකි උපරිම ආකාරයෙන්ද?" යන ප්‍රශ්නයට යොමු විය යුතුය.
matt_asbury

1
සරල වාක්‍යය කරුණාකර{} පෙළ කොටුව වටා ඇති බොත්තම භාවිතයෙන් කේතය සලකුණු කරන්න .
Paŭlo Ebermann

11

සියලුම කේත භාෂාව '[]', ';', '()' වැනි විශේෂ අක්ෂර මත රඳා පවතින නිසා ව්‍යාජ කේතය සැබෑ අභියෝගයක් වනු ඇත. මෙම විශේෂ අක්ෂර ඇතිවීම සරලව ගණන් කරන්න. ඔබ ද්විමය ගොනුවක් හඳුනාගන්නාක් මෙන් (නියැදියක 5% කට වඩා බයිට් අගය 0 අඩංගු වේ).


[] () වැනි මෙම විශේෂ අක්ෂරවල කණ්ඩායම් ඇති තරමට මම මෙය වැඩි දියුණු කරමි; {} =. මෙම කණ්ඩායම් වලින් 2-3 කට වඩා ඇති සෑම පේළියක්ම කේත රේඛාවකි.
හොන්සා

... තවද වඩාත් පොදු භාෂාවලින් පොදු නූල් සොයන්න, උදා: "= යම් වචන ();" බොහෝ වක්‍ර වරහන් භාෂාවන් සඳහා, "<something>" සහ "<ab: cde>" වැනි XML වැනි සින්ටැක්ස් සහ වෙනත් භාෂාවල ඇති පොදු නූල්. ක්‍රියාත්මක කිරීමට නව භාෂා සොයාගත් විට ඔබට එය පුළුල් කළ හැකි බැවින් පොදු වාක්‍ය ඛණ්ඩයේ යම් ආකාරයක බැලීමේ වගුවක් හොඳ විසඳුමක් වනු ඇතැයි මම විශ්වාස කරමි.
Arve Systad

ඔබ බොහෝ විට ව්‍යාජ කේත අතහැර දැමිය යුතුය. සමහර අය එය සී-ශෛලීය භාෂාවක් ලෙස ලිවීමට කැමති නමුත් අනෙක් අය VB6 ට වඩා සමීප යමක් සහිත සරල ඉංග්‍රීසි භාවිතා කරනු ඇත
ජේම්ස් පී.

4

ඔබට මෙය නිශ්චිත භාෂාවන්ට පමණක් ඉලක්ක කිරීමට අවශ්‍ය විය හැකි යැයි මම සිතමි, පොදුවේ මෙම ගැටළුව ඔබට ඉංග්‍රීසි හා සමාන භාෂා ලබා ගත හැකි බැවින් එය නොවැළැක්විය හැකිය (උදා: දැනුම් 7 ). නමුත් වාසනාවකට මෙන් වැඩිපුරම භාවිතා කළ ඒවා තරමක් පහසුවෙන් ආවරණය කළ හැකිය.

මගේ පළමු කප්පාදුව වනුයේ "; \ n" අනුක්‍රමය සෙවීමයි, එමඟින් ඔබට සී, සී ++, ජාවා, සී # සහ වෙනත් ඕනෑම භාෂාවක් සඳහා සමාන වාක්‍ය ඛණ්ඩයක් භාවිතා කරන අතර එය ඉතා සරල ය. එය ඉංග්‍රීසියෙන් a ට වඩා අඩු විය හැකිය; නව රේඛාවක් නොමැතිව


රැලි සහිත වරහන් බහුල විය හැකිය; p
මාක් ග්‍රෙවෙල්

1
ජෙෆ් සිය ලිපියේ පවසන පරිදි, ඔවුන් බොහෝ විට ඉලක්ක කරන්නේ ප්‍රධාන භාෂාවන් පමණි. කෙසේ වෙතත්, නව පරිශීලකයින් (මෙම ක්‍රියාකාරීත්වය අපේක්ෂා කරන) C # හෝ ජාවාස්ක්‍රිප්ට් පළ කිරීමට වඩා වැඩි වනු ඇතැයි මම සැක කරමි, ඉන්ටර්කල් ;-)
බෙන්

ඔව්, නමුත් මෙය ක්‍රමලේඛන භාෂාව BRAINFUCK හෝ BLANK සමඟ ක්‍රියා නොකරනු ඇත. ;-)
අයිවෝ ලිමන්

4

කවුරුහරි ටැග් දෙස බලා පසුව ඒ සඳහා සින්ටැක්ස් සොයමින් සිටින බව සඳහන් කළ නමුත් එය නව පරිශීලකයින් ඉලක්ක කර ගත් නිසා එය වෙඩි තබා ඇත.

වඩා හොඳ විසඳුමක් වනුයේ ප්‍රශ්නයේ ශරීරයේ භාෂා නම් සෙවීමයි, ඉන්පසු එම උපක්‍රමයම ක්‍රියාත්මක කරන්න. මම "ජාවාස්ක්‍රිප්ට්", "ජාවා" හෝ "සී #" සඳහන් කළහොත්, ප්‍රශ්නය වන්නේ එයයි, සහ ප්‍රශ්නයේ කේතය එම භාෂාවෙන් විය හැකිය.


විශේෂයෙන් මාතෘකාව "vb c # .net dot net මට උදව් කරන්න වගේ" නම්.
නික් ඕල්ඩ්වින්

1

පළමුවෙන්ම, අක්ෂර වින්‍යාසය පිරික්සීමෙන් එය ක්‍රියාත්මක කරන්න, එය නිසි ඉංග්‍රීසි වචන ස්වල්පයක් සොයාගනු ඇත, කෙසේ වෙතත් අක්ෂර වින්‍යාසය මඟින් බෙදීමට යෝජනා කරන වචන විශාල ප්‍රමාණයක් තිබිය යුතුය.

සරල ඉංග්‍රීසි සඳහා සාමාන්‍ය නොවන, කේත සඳහා සාමාන්‍ය, විරාම ලකුණු / විශේෂ අක්ෂර ඇත:

  • something(); සරල ඉංග්‍රීසි විය නොහැක.
  • $somethingsomethingසියල්ල සංඛ්‍යාත්මක නොවන තැන ;
  • -> වචන අතර අවකාශය;
  • . වචන අතර අවකාශය;

ඇත්ත වශයෙන්ම එය හොඳින් ක්‍රියාත්මක වීමට නම්, ඔබට මෙම ලක්ෂණ මත බේසියානු වර්ගීකරණයක් ගොඩනගා ගැනීමට අවශ්‍ය විය හැකිය.


1
() අඩංගු නොවූ පේළියක් හඳුනා ගැනීම; පණිවිඩය යෝජනා කිරීමට හොඳ හේතුවක් වනු ඇත.

කේතය ඇලවීමට පෙර කුමන අක්ෂර වින්‍යාසය පිරික්සන්නේද?
ටිම් පෝස්ට්

ස්වදේශීය නොවන ඉංග්‍රීසි ලේඛකයින් විසින් ලියන ලද සමහර පණිවිඩ සමඟ, අක්ෂර වින්‍යාසය අනෙක් සෑම වචනයක්ම යටපත් කරනු ඇත ...
ෆිල්හෝ

HPh: කෙසේ වෙතත් මෙම ප්‍රශ්න / පිළිතුරු SO හි පිළිගනු නොලැබේ.
vartec

1

සමාන සින්ටැක්ස් බෙදාගන්නා භාෂා කට්ටල කිහිපයක් තිබේ. බොහෝ භාෂාවන් භාෂා කිහිපයකින් බලපෑම් ඇති කර ඇති බැවින් භාෂා [AMPL, AWK, csh, C ++, C--, C #, Objective-C, BitC, D, Go, Java, JavaScript, Limbo, LPC, Perl, PHP, පයික්, සැකසුම් [සියල්ලම සී මගින් බලපෑම් ඇති කරන ලදි, එබැවින් ඔබ සී හඳුනා ගන්නේ නම් මෙම භාෂා සියල්ලම ඔබ හඳුනා ගනු ඇත. එබැවින් ඔබට කළ යුතුව ඇත්තේ මෙම භාෂා කට්ටල හඳුනා ගැනීම සඳහා සරල රටාවක් ලිවීම පමණි.

බොහෝ කේත නව රේඛා දෙකකින් හෝ පෝස්ට් එකේ අනෙක් පෙළ කොටස් වලට සමාන වන නිසා මම පෙළ කොටස් වලට බෙදමි.

ජාවාස්ක්‍රිප්ට් සමඟ මෙය පහසුවෙන් කළ හැකිය (සී පවුල සඳහා සුපිරි අසම්පූර්ණ නියැදියක්):

var txt = "my problem is I need to change the database but I don't won't to create a new connection. example:\n\nDataSet dsMasterInfo = new DataSet();Database db = DatabaseFactory.CreateDatabase(&quot;ConnectionString&quot;);DbCommand dbCommand = db.GetStoredProcCommand(&quot;uspGetMasterName&quot;);";
var blocks = txt.split(/\n\n/gi); console.dir(blocks);
var i = blocks.length;
var cReg = /if\s*\(.+?\)|.*(?:int|char|string|short|long).*?=.+|while\s*\(.+?\)/gi;

while ( i-- ){
   var current = blocks[i];
   if ( cReg.test( current ) ){
      console.log("found code in block[" +  i + "]");
   }
}

0

එක් එක් පේළිය සඳහා වචන / විරාම ලකුණු අක්‍ෂර ගණනය කරන්න. ඉංග්‍රීසි 4 ක් හෝ ඊට වැඩි ගණනක් ඇති අතර කේතය 2 ට වඩා අඩුය.

ඉහත ඡේදයේ වචන 18 ක් සහ විරාම ලකුණු 4 ක් ඇත. මෙම ඡේදයේ වචන 19 ක් සහ විරාම ලකුණු 4 ක් ඇත, එබැවින් අපේක්ෂාවන් තුළ.

ඇත්ත වශයෙන්ම, මෙය නවක දුප්පත්-ඉංග්‍රීසි කථිකයන්ගේ ප්‍රශ්න වලට එරෙහිව පරීක්‍ෂා කිරීම අවශ්‍ය වන අතර, සමහර විට සංඛ්‍යාලේඛන නොපැහැදිලි වේ.

[සුදු අවකාශය]

මම හිතන්නේ ලොකුම ගැටලුව වනුයේ පේළිගත කේතයක් වන අතර එහිදී යමෙකු මෙවැනි ප්‍රශ්නයක් අසයි:

(I = 0; i> 100; i ++) සඳහා මම කියන්නේ නම්} that එයින් අදහස් කරන්නේ කුමක්ද?

එය කේතය සහ ඉංග්‍රීසි වන අතර පසුපස කිනිතුල්ලන් මෙන් සලකුණු කළ යුතුය:

මම කිව්වොත් for (i=0; i>100; i++) {}එයින් අදහස් කරන්නේ කුමක්ද?


0

ඇත්ත වශයෙන්ම නම් කළ යුතු (ප්‍රමාණවත් ලෙස) ආකෘතිගත කළ කේතය සහ (කෙසේ වෙතත්) අතින් හැඩතල ගැන්වීම අවශ්‍ය වන දුර්වල ලෙස ආකෘතිකරණය කළ කේතය අතර වෙනසක් ඔබ විසින් කළ යුතු යැයි මම සිතමි.

ආකෘතිගත කේතයට බ්‍රේක්ලයින් සහ ඉන්ඩෙන්ටේෂන් ඇත. එනම්: රේඛාවක් තනි කඩාවැටීමකට පෙර නම්, ඔබට හොඳ අපේක්ෂකයෙක් සිටී. එයට ඉහළින් ප්‍රමුඛ සුදු අවකාශ තිබේ නම්, ඔබට ඉතා හොඳ අපේක්ෂකයෙක් සිටී.

සාමාන්‍ය පා text ය බ්‍රේක්ලයින් දෙකක් හෝ අවකාශ දෙකක් සහ හැඩතල ගැන්වීම සඳහා බ්‍රේක්ලයින් භාවිතා කරයි, එබැවින් වෙනස සඳහා පැහැදිලි නිර්ණායකයක් ඇත.

LISP කේතයේ ඔබට අර්ධ සළකුණු සොයාගත නොහැකි වනු ඇත, රූබි කේතයෙන් ඔබට වරහන් සොයාගත නොහැකි වනු ඇත, ව්‍යාජ කේතයෙන් ඔබට බොහෝ දේ සොයාගත නොහැකි වනු ඇත. නමුත් ඕනෑම (එසෝටරික් නොවන) භාෂාවක හොඳ කේතයන් කඩිනම් හා ඉන්ඩෙන්ටේෂන් සමඟ සංයුති කළ හැකිය. එතරම් විශ්වීය කිසිවක් නැත. මන්ද අවසාන කේතය මිනිසුන් විසින් කියවීමට ලියා ඇති බැවිනි.

එබැවින් පළමුව, කේතයේ විභව රේඛා සොයන්න . එසේම, කේත රේඛා සාමාන්‍යයෙන් කණ්ඩායම් වශයෙන් පැමිණේ. ඔබට එකක් තිබේ නම්, ඉහළින් හෝ පහළින් ඇති කේත රේඛාවක් වීමට හොඳ අවස්ථාවක් තිබේ.

ඔබ විභව කේත රේඛා තෝරාගත් පසු, ඔබට ඒවා ප්‍රමාණාත්මක නිර්ණායකයන්ට අනුකූලව පරීක්ෂා කර යම් සීමාවක් තෝරා ගත හැකිය :

  • වචන නොවන අක්ෂරවල සංඛ්‍යාතය
  • හඳුනාගැනීමේ සංඛ්‍යාතය: කැමල් කේස් හෝ අඩු ලකුණු ශෛලිය සහිත ඉතා කෙටි වචන හෝ ඉතා දිගු වචන
  • අසාමාන්‍ය වචන පුනරාවර්තනය කිරීම

එසේම, දැන් ක්‍රමලේඛකයින් සහ සීඑස් ඇති බැවින්, ස්ටැක් ඕවර් ප්‍රවාහයේ විෂය පථය පැහැදිලිවම පටු වී ඇත. සියලු භාෂා ටැග් භාෂා ලෙස දැක්වීම කෙනෙකුට සලකා බැලිය හැකිය. පළ කරන විට, අවම වශයෙන් එක් භාෂා ටැගයක්වත් තෝරා ගැනීමට, language-agnosticටැගය තෝරා ගැනීමට හෝ එය පැහැදිලිවම මඟ හැරීමට ඔබෙන් අසනු ඇත .

පළමු අවස්ථාවේ දී ඔබ කුමන භාෂාවන් සෙවිය යුතු දැයි ඔබ දනී, දෙවන අවස්ථාවේ දී, ඔබට ව්‍යාජ කේතයක් සෙවීමට අවශ්‍ය විය හැකි අතර අවසාන අවස්ථාවේ දී, කිසිදු කේතයක් නොතිබෙනු ඇත, මන්ද එය යම් තාක්‍ෂණයකට සම්බන්ධ ප්‍රශ්නයක් හෝ රාමුව හෝ එවැනි.


0

ඔබට හඳුනා ගැනීමට අවශ්‍ය සෑම භාෂාවක් සඳහාම විග්‍රහයක් සෑදිය හැකිය (ANTLR සඳහා භාෂා අර්ථ දැක්වීම් සාමාන්‍යයෙන් සොයා ගැනීම පහසුය), ඉන්පසු එක් එක් පාර්සර් හරහා ප්‍රශ්නයේ සෑම පේළියක්ම ධාවනය කරන්න. කිසියම් පේළියක් නිවැරදිව විග්‍රහ කරන්නේ නම්, ඔබට බොහෝ විට කේත ඇත.

මෙහි ඇති ගැටළුව නම් සමහර ඉංග්‍රීසි (ස්වාභාවික භාෂා) වාක්‍ය කේතයක් ලෙස විග්‍රහ කළ හැකි බැවින් ඔබට වෙනත් අදහස්ද ඇතුළත් කිරීමට අවශ්‍ය විය හැකිය, නැතහොත් ඔබට ධනාත්මක ප්‍රති results ල සීමා කළ හැක්කේ අඛණ්ඩ පේළි එකකට හෝ දෙකකට වඩා නිවැරදිව විග්‍රහ කළහොත් පමණි. එකම භාෂා විග්‍රහකය.

අනෙක් විභව ගැටළුව නම් මෙය බොහෝ විට ව්‍යාජ කේතයක් තෝරා නොගන්නා නමුත් එය හරි විය හැකිය.


බොහෝ විට මිනිසුන්ගේ කේතයේ සින්ටැක්ස් දෝෂ තිබේ (ඔවුන් මේ ගැන විමසයි).
Paŭlo Ebermann

0

අනෙකුත් භාෂාවන් (දැන් වැඩිපුරම භාවිතා කරන ක්‍රමලේඛන භාෂාවන්ට වඩා තරමක් වෙනස් ලෙස පෙනෙන) වඩාත් ජනප්‍රිය වන අතර දැනට භාවිතා වන භාෂා අඩු ජනප්‍රිය වී ඇති හෙයින්, වඩාත්ම අනාගත-සාධනය විය හැකි සහ දිගු කාලීනව අවම වශයෙන් අතින් සකස් කිරීම අවශ්‍ය වන්නේ කුමක් ද? ගූගල් පරිවර්තනය කරන දේ වැනි දෙයක් (ab සහ a () වැනි සමහර දේවල් සොයනවා වෙනුවට "එය ක්‍රියාත්මක වන්නේ කෙසේද?" යන ඡේදය බලන්න).

වෙනත් වචන වලින් කිවහොත්, සෙවීම සඳහා කේතයේ ඇති රටා ගැන අතින් සිතීම වෙනුවට, පරිගණකයට එය තනිවම හඳුනාගත හැකිය . මෙය කිරීමෙන් කළ හැකිය

  1. විවිධ ක්‍රමලේඛන භාෂාවල කේත ගොඩක්

    • යෝජනාව: ගූගල් කේත හෝ ගිතුබ් වැනි වෙබ්-පාදක ප්‍රභව කේත ගබඩාවලින් හෝ දැනටමත් කේතයක් ලෙස සලකුණු කර ඇති ස්ටැක්ඕවර්ෆ්ලෝ වෙතින් පවා කේත සාම්පල ස්වයංක්‍රීයව ගන්න.

    • සටහන: කේත අදහස් විග්‍රහ කිරීම හොඳ අදහසක් විය හැකිය

  2. වෙබයේ ලිපි වලින් ලබාගත් ඉංග්‍රීසි පෙළ ගොඩක්

    • ක්‍රමලේඛනය පිළිබඳ ලිපි වලින් නොවුනත් (එසේ නොමැතිනම් ඒවායේ කේත ඇති අතර පද්ධතිය මිශ්‍ර කළ හැකිය :-))

ස්වයංක්‍රීයව යම් ආකාරයක ඇල්ගොරිතමයක් තිබීම තිබීම, ඉංග්‍රීසි නොවන කේතයේ රටා සොයා ගන්නා අතර, අනෙක් අතට, පෝස්ට් වල ඇල්ගොරිතම ක්‍රියාත්මක කිරීමෙන් කේතය සහ කේතය නොවන දේ හඳුනා ගැනීමට එම රටා භාවිතා කරයි.

(කෙසේ වෙතත්, එවැනි ඇල්ගොරිතමයක් ක්‍රියාත්මක වන්නේ කෙසේදැයි මට විශ්වාස නැත. වර්තමාන ප්‍රශ්නයට වෙනත් පිළිතුරු සඳහා ඒ සඳහා ප්‍රයෝජනවත් තොරතුරු තිබිය හැකිය.)

එවිට පද්ධතියට වරකට වරක් කේතය නැවත පරිලෝකනය කළ හැකි අතර එම අවස්ථාවේ දී කේතය දෙස බලන ආකාරයෙහි වෙනස්කම් සඳහා ගණනය කළ හැකිය.

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.