දත්ත කැණීම, සංඛ්‍යාලේඛන, යන්ත්‍ර ඉගෙනීම සහ AI අතර වෙනස කුමක්ද?


214

දත්ත කැණීම, සංඛ්‍යාලේඛන, යන්ත්‍ර ඉගෙනීම සහ AI අතර වෙනස කුමක්ද?

ඒවා ඉතා සමාන ගැටළු විසඳීමට උත්සාහ කරන නමුත් විවිධ ප්‍රවේශයන් සහිත ක්ෂේත්‍ර 4 ක් යැයි පැවසීම නිවැරදිද? ඔවුන්ට පොදුවේ ඇත්තේ කුමක්ද සහ ඒවා වෙනස් වන්නේ කොතැනින්ද? ඔවුන් අතර යම් ආකාරයක ධූරාවලියක් තිබේ නම්, එය කුමක් වනු ඇත්ද?

මීට පෙරද මෙවැනිම ප්‍රශ්න අසන ලද නමුත් මට තවමත් එය ලැබී නැත:

Answers:


113

මේවා අතර සැලකිය යුතු අතිච්ඡාදනයන් ඇත, නමුත් සමහර වෙනස්කම් කළ හැකිය. අවශ්‍යතාවය නම්, මට සමහර දේවල් ඕනෑවට වඩා සරල කිරීමට හෝ අනෙක් අයට කෙටි-කෙටි කිරීමක් කිරීමට සිදුවනු ඇත, නමුත් මෙම ක්ෂේත්‍රයන් පිළිබඳ යම් අවබෝධයක් ලබා දීමට මම උපරිම උත්සාහය දරමි.

පළමුව, කෘතිම බුද්ධිය අනෙක් ඒවාට වඩා තරමක් වෙනස් ය. AI යනු බුද්ධිමත් නියෝජිතයන් නිර්මාණය කරන්නේ කෙසේද යන්න අධ්‍යයනය කිරීමයි. ප්‍රායෝගිකව, එය බුද්ධිමත් නියෝජිතයෙකු ලෙස (පුද්ගලයෙකු පවසන පරිදි) හැසිරීමට හා කාර්යයක් කිරීමට පරිගණකයක් ක්‍රමලේඛනය කරන්නේ කෙසේද යන්නයි. මෙම නැත ඇති සියලු දී හෝ ඉගෙනීමෙන් උද්ගමන සම්බන්ධ කර ගැනීමට, එය 'වඩා හොඳ mousetrap ගොඩනැගීම' කිරීමට ක්රමයක් විය හැක. නිදසුනක් ලෙස, AI යෙදුම්වල අඛණ්ඩ ක්‍රියාවලීන් නිරීක්ෂණය කිරීම සහ පාලනය කිරීම සඳහා වැඩසටහන් ඇතුළත් කර ඇත (උදා: එය අඩු බව පෙනේ නම් A වර්ගය වැඩි කරන්න). යන්ත්‍රයක් කරන ඕනෑම දෙයක් 'මෝඩ ලෙස' නොකරන තාක් කල් AI ට ඕනෑම දෙයක් ඇතුළත් කළ හැකි බව සලකන්න.

කෙසේ වෙතත්, ප්‍රායෝගිකව, බුද්ධිය අවශ්‍ය බොහෝ කාර්යයන් සඳහා අත්දැකීම් වලින් නව දැනුම ලබා ගැනීමට හැකියාවක් අවශ්‍ය වේ. මේ අනුව, AI තුළ විශාල ප්‍රදේශයක් වන්නේ යන්ත්‍ර ඉගෙනීමයි . යම් කාර්ය සාධන මිනුමකට අනුව, පරිගණක වැඩසටහනක් අත්දැකීම් වලින් යම් කාර්යයක් ඉගෙන ගන්නේ නම් අත්දැකීම් වලින් යම් කාර්යයක් ඉගෙන ගනු ඇතැයි කියනු ලැබේ. යන්ත්‍ර ඉගෙනීම යනු තොරතුරු ස්වයංක්‍රීයව උකහා ගත හැකි ඇල්ගොරිතම අධ්‍යයනය කිරීමයි (එනම්, මාර්ගගත මානව මග පෙන්වීමකින් තොරව). එය සෘජුවම ව්යුත්පන්න මෙම ක්රමවේදයන් සමහර අදහස් ඇතුළත් බව නිසැකව නඩුව, හෝ දේවානුභාවයෙන්, සම්භාව්ය සංඛ්යා ලේඛන, නමුත් ඔවුන් නැහැ ඇතිවීමට. AI හා සමානවම, යන්ත්‍ර ඉගෙනීම ඉතා පුළුල් වන අතර සෑම දෙයක්ම පාහේ ඇතුළත් කළ හැකිය, එයට යම් ප්‍රේරක අංගයක් පවතින තාක් කල්. යන්ත්‍ර ඉගෙනීමේ ඇල්ගොරිතම සඳහා උදාහරණයක් කල්මන් ෆිල්ටරයක් ​​විය හැකිය.

දත්ත පතල් යන්ත්රය ඉගෙනුම් උද්වේගය හා ශිල්පීය ක්රම බොහෝ ගෙන ඇති බව ප්රදේශය (සහ ඇතැම් ද, සංඛ්යා ලේඛන සිට), නමුත් වෙනස් කර ගැනීමට නියමිත අවසන් . දත්ත කැණීම පුද්ගලයෙකු විසින් , නිශ්චිත තත්වයක් තුළ, නිශ්චිත දත්ත කට්ටලයක් මත, ඉලක්කයක් මනසේ තබාගෙන සිදු කරයි. සාමාන්‍යයෙන්, මෙම පුද්ගලයාට යන්ත්‍ර ඉගෙනීමේ දී වර්ධනය කර ඇති විවිධ රටා හඳුනාගැනීමේ ක්‍රමවේදයන්ගේ බලය උකහා ගැනීමට අවශ්‍ය වේ. බොහෝ විට, දත්ත කට්ටලය දැවැන්ත , සංකීර්ණ සහ / හෝ විශේෂ ගැටළු ඇති විය හැකිය(නිරීක්ෂණවලට වඩා විචල්යයන් වැනි). සාමාන්‍යයෙන්, ඉලක්කය වනුයේ කලින් දැනුමක් නොතිබූ ප්‍රදේශයක මූලික අවබෝධය සොයා ගැනීම / උත්පාදනය කිරීම හෝ අනාගත නිරීක්ෂණ නිවැරදිව පුරෝකථනය කිරීමට හැකිවීම ය. එපමණක් නොව, දත්ත කැණීමේ ක්‍රියා පටිපාටීන් 'අධීක්ෂණය නොකළ' (අපි පිළිතුර - සොයා ගැනීම නොදනිමු) හෝ 'අධීක්ෂණය' කළ හැකිය (පිළිතුර අපි දනිමු - පුරෝකථනය). ඉලක්කය සාමාන්‍යයෙන් යටින් පවතින දත්ත උත්පාදනය කිරීමේ ක්‍රියාවලිය පිළිබඳ වඩාත් නවීන අවබෝධයක් වර්ධනය කිරීම නොවන බව සලකන්න . පොදුවේ දත්ත කැණීමේ ක්‍රමවලට පොකුරු විශ්ලේෂණයන්, වර්ගීකරණය සහ ප්‍රතිගාමී ගස් සහ ස්නායුක ජාල ඇතුළත් වේ.

මෙම වෙබ් අඩවියේ සංඛ්‍යාලේඛන මොනවාදැයි පැහැදිලි කිරීමට මට වැඩි යමක් කිව යුතු නැතැයි සිතමි , නමුත් සමහර විට මට කරුණු කිහිපයක් පැවසිය හැකිය. සම්භාව්‍ය සංඛ්‍යාලේඛන (මෙහි මා අදහස් කරන්නේ නිතර නිතර සහ බේසියානු යන දෙකම) ගණිතය තුළ උප මාතෘකාවකි. මම එය බොහෝ දුරට සම්භාවිතාව ගැන දන්නා දේ සහ ප්‍රශස්තිකරණය ගැන අප දන්නා දේ අතර මංසන්ධියක් ලෙස සිතමි. ගණිතමය සංඛ්‍යාලේඛන හුදෙක් ප්ලැටෝනික් විමර්ශන වස්තුවක් ලෙස හැදෑරිය හැකි වුවද, එය බොහෝ දුරට වඩා ප්‍රායෝගික යැයි වටහාගෙන ඇති අතර ගණිතයේ වෙනත් දුර්ලභ ක්ෂේත්‍රයන්ට වඩා චරිතයෙන් එය අදාළ වේ. එනිසා (සහ විශේෂයෙන් ඉහත දත්ත කැණීමට වඩා වෙනස්ව), එය බොහෝ විට භාවිතා කරනුයේ යම් නිශ්චිත දත්ත උත්පාදනය කිරීමේ ක්‍රියාවලිය වඩා හොඳින් අවබෝධ කර ගැනීම සඳහා ය. මේ අනුව, එය සාමාන්‍යයෙන් ආරම්භ වන්නේ විධිමත් ලෙස නිශ්චිත ආකෘතියකින් ය, සහ මෙයින් ව්‍යුත්පන්න කර ඇත්තේ එම ආකෘතිය is ෝෂාකාරී අවස්ථාවන්ගෙන් (එනම්, තක්සේරු කිරීම - කිසියම් අලාභයක් ප්‍රශස්ත කිරීම මගින්) නිවැරදිව උකහා ගැනීම සහ වෙනත් හැකියාවන්ගෙන් (එනම් නියැදි බෙදාහැරීම්වල දන්නා ගුණාංග මත පදනම් වූ අනුමාන කිරීම්) වෙන්කර හඳුනා ගැනීමට හැකි වීමයි. මූලාකෘති සංඛ්‍යාන තාක්‍ෂණය යනු ප්‍රතිගාමී වීමයි.


1
මම බොහෝ තනතුර සමඟ එකඟ වෙමි, නමුත් මම කියන්නේ AI බොහෝ විට බුද්ධිමත් නියෝජිතයන් (බුද්ධිය යනු කුමක්ද?) නිර්මාණය කිරීමට උත්සාහ නොකරන නමුත් තාර්කික නියෝජිතයන් බවයි. තාර්කික වශයෙන් එහි අර්ථය “ලෝකය පිළිබඳ පවතින දැනුම අනුව ප්‍රශස්ත” යන්නයි. පිළිගත හැකි වුවත් අවසාන ඉලක්කය සාමාන්‍ය ගැටළු විසඳන්නෙකු වැනි ය.
kutschkem

3
කණගාටුයි, දත්ත කැණීම සහ යන්ත්‍ර ඉගෙනීම අතර වෙනස මට තවමත් ලැබී නැත. මා දකින දෙයින්, දත්ත කැණීම = යන්ත්‍ර ඉගෙනීමේ අධීක්ෂණය නොකළ ඉගෙනීම. යන්ත්‍ර ඉගෙනීම නව තීක්ෂ්ණ බුද්ධිය සොයා ගැනීම අධීක්ෂණය කර නැද්ද?
dtc

පරාමිති පදනමක් මත දත්ත කැණීම සහ යන්ත්‍ර ඉගෙනීම අතර ඇති වෙනස්කම් බිඳ දමමින් වගුවක් සඳහා නිර්නාමික පරිශීලකයෙකු මෙම බ්ලොග් පෝස්ට් යෝජනා කළේය .
gung - මොනිකා නැවත

1
Common data mining techniques would include cluster analyses, classification and regression trees, and neural networks.දත්ත කැණීම සඳහා භාවිතා කරන යන්ත්‍ර ඉගෙනීම සඳහා නිර්මාණය කර නොමැති ඇල්ගොරිතමයක් වන පොකුරු විශ්ලේෂණයකට සාපේක්ෂව ස්නායුක ජාලයක් යනු දත්ත කැණීමේදී භාවිතා කරන යන්ත්‍ර ඉගෙනීමේ මෙවලමකට උදාහරණයක් යැයි පැවසීම ආරක්ෂිත ද ?
t0mgs

යථාර්ථයේ දී ඒ සියල්ල නොපැහැදිලි ය, @ ටොම් ග්‍රැනට්-ස්කාලොසුබ්. ස්නායුක ජාල අනිවාර්යයෙන්ම එම්එල් යැයි මම කියමි, නිසැකවම පොකුරු විශ්ලේෂණය සහ CART එම්එල් පර්යේෂකයන් විසින් අධ්‍යයනය කරනු ලැබේ. අදහස් තරමක් පැහැදිලි සහ පැහැදිලි කිරීමට මම උත්සාහ කරමි, නමුත් ඇත්ත වශයෙන්ම මෙම කාණ්ඩ අතර දීප්තිමත් රේඛාවක් නොමැත.
gung - මොනිකා නැවත

43

තවත් බොහෝ පිළිතුරු ප්‍රධාන කරුණු ආවරණය කර ඇති නමුත් ඔබ ධූරාවලියක් ඉල්ලා සිටියේ කිසියම් දෙයක් තිබේ නම් සහ මා දකින ආකාරය අනුව, ඒවා එක් එක් විෂයයන් ඔවුන්ගේම අභිමතය පරිදි වුවද, සෑම එකක්ම ගොඩනඟා ඇති බැවින් කිසිවෙකු තවම සඳහන් කර නැති ධූරාවලියක් ඇත කලින් එක.

සංඛ්‍යාලේඛන යනු සංඛ්‍යා හා දත්ත ප්‍රමාණ කිරීම පමණි. දත්තවල අදාළ ගුණාංග සොයා ගැනීම සඳහා බොහෝ මෙවලම් ඇති නමුත් මෙය පිරිසිදු ගණිතයට බෙහෙවින් සමීප ය.

දත්ත කැණීම යනු සංඛ්‍යාලේඛන මෙන්ම වෙනත් ක්‍රමලේඛන ක්‍රම භාවිතා කරමින් දත්තවල සැඟවී ඇති රටා සොයා ගැනීමයි. එවිට ඔබට යම් සංසිද්ධියක් පැහැදිලි කළ හැකිය . දත්ත පතල් කිරීම සමහර දත්තවල සැබවින්ම සිදුවෙමින් පවතින දේ පිළිබඳ ප්‍රතිභානය ගොඩනංවන අතර එය ක්‍රමලේඛනයට වඩා ගණිතය කෙරෙහි තව ටිකක් වැඩි ය, නමුත් දෙකම භාවිතා කරයි.

යන්ත්‍ර ඉගෙනීම මඟින් දත්ත කැණීමේ ශිල්පීය ක්‍රම සහ වෙනත් ඉගෙනුම් ඇල්ගොරිතම භාවිතා කරමින් සමහර දත්ත පිටුපස සිදුවෙමින් පවතින දේ පිළිබඳ ආකෘති ගොඩනඟා ගැනීමට හැකි වන අතර එමඟින් අනාගත ප්‍රති .ල පුරෝකථනය කළ හැකිය. බොහෝ ඇල්ගොරිතම සඳහා ගණිතය පදනම වන නමුත් මෙය ක්‍රමලේඛනය කෙරෙහි වැඩි ය.

කෘතිම බුද්ධිය යන්ත්‍ර ඉගෙනීම සහ වෙනත් ක්‍රම පිළිබඳව ලෝකය ගැන තර්ක කිරීමට සහ මෙය ක්‍රීඩාවක් කරනවාද නැත්නම් රොබෝ / මෝටර් රථයක් ධාවනය කරන්නේද යන්න බුද්ධිමත් හැසිරීම් වලට හේතු වන ආකෘති භාවිතා කරයි . කෘතිම බුද්ධියට යම් ඉලක්කයක් සපුරා ගත හැකි අතර එය ක්‍රියාවන් ලෝකයේ ආකෘතියට බලපාන්නේ කෙසේද යන්න පුරෝකථනය කිරීමෙන් සහ එම ඉලක්කය සපුරා ගත හැකි ක්‍රියාමාර්ග තෝරා ගනී. ඉතා ක්‍රමලේඛන පදනම් කරගත්.

කෙටියෙන්

  • සංඛ්යා ලේඛන quantifies අංක
  • දත්ත කැණීම් රටා පැහැදිලි කරයි
  • යන්ත්‍ර ඉගෙනීම ආකෘති සමඟ පුරෝකථනය කරයි
  • කෘතිම බුද්ධිය හැසිරෙන සහ හේතු

දැන් මෙය පැවසුවහොත්, සමහර AI ගැටළු AI වලට පමණක් වැටෙන අතර අනෙක් ක්ෂේත්‍ර සඳහා ද ඒ හා සමාන වනු ඇත. නමුත් අද පවතින බොහෝ සිත්ගන්නාසුලු ගැටලු (නිදසුනක් ලෙස ස්වයං රිය පැදවීමේ කාර්) මේ සියල්ල පහසුවෙන් හා නිවැරදිව හැඳින්විය හැකිය. මෙය ඔබ ඇසූ ඔවුන් අතර ඇති සම්බන්ධය පැහැදිලි කරයි යැයි සිතමු.


ඔබ කවදා හෝ WEKA හෝ RapidMiner භාවිතා කර තිබේද? උදාහරණයක් ලෙස, ඊඑම් දත්ත කැණීම් තුළ පවතින අතර එය ආකෘතියක් අදාළ කරයි. ඒ හැරුණු විට, මරියානා සොෆර් විසින් ලබා දී ඇති අර්ථ දැක්වීම පරීක්ෂා කර එය ඔබේ පිළිතුර සමඟ සසඳන්න. මීට වසර කිහිපයකට පෙර මම බිෂොප් සහ රසල් / නොර්විග් කියවූ නමුත් මට මතක හැටියට ඩෙෆ්. මරියානා සොෆර් විසින් වඩාත් සුදුසු වේ. btw දත්ත කැණීම ("පමණක්") දැනුම සොයා ගැනීමට පෙර ඇති ප්‍රධාන පියවරයි. දත්ත කැණීම යනු දත්ත සඳහා පමණක් වන අතර පසුව තොරතුරු සඳහා - ප්‍රමාණවත් පරාමිතීන් සහිත ඇල්ගොරිතමයක් භාවිතා කරන විට. දත්ත කැණීම් රටා පැහැදිලි කළ නොහැක.
mnemonic

නැහැ, @mnemonic, කෘෂිකර්ම උපදේශක මෙම අර්ථ දැක්වීම වඩාත් රසල් හා Norvig අනුකූලව ඉතා දිනැති වන මරියානා ගේ, වඩා
nealmcb

2
මම හිතන්නේ සංඛ්‍යාලේඛන විස්තරය දුර්වලයි; ප්‍රමාණාත්මක සංඛ්‍යා යනු ජාතික සංඛ්‍යාලේඛන දෙපාර්තමේන්තුව විසින් වාර්තා කරන සංඛ්‍යාලේඛන වේ, නමුත් මෙය දත්ත සඳහා ආකෘති නිර්මාණය කිරීම, ඒවායේ පරාමිතීන් තක්සේරු කිරීම සහ අනුමාන කිරීම් සිදු කරන සංඛ්‍යාන විද්‍යාවට සමාන නොවේ. එසේම, දත්ත කැණීම සහ යන්ත්‍ර ඉගෙනීම අතර සම්බන්ධතාවය උඩු යටිකුරු වී ඇත; දත්ත විද්‍යාව යන්ත්‍ර ඉගෙනීමේ ක්‍රම භාවිතා කරයි, අනෙක් පැත්තෙන් නොවේ. කෙන් වැන් හරෙන්ගේ පිළිතුරද බලන්න.
රිචඩ් හාඩි

26
  • සංඛ්‍යාලේඛන සම්භාවිතා ආකෘති කෙරෙහි සැලකිලිමත් වන අතර, විශේෂයෙන් දත්ත භාවිතා කරමින් මෙම ආකෘති පිළිබඳව අනුමාන කරයි.
  • යන්ත්‍ර ඉගෙනීම යම් දත්තයක් ලබා දී ඇති නිශ්චිත ප්‍රති come ලයක් ගැන පුරෝකථනය කිරීම ගැන සැලකිලිමත් වේ. ඕනෑම සාධාරණ යන්ත්‍ර ඉගෙනීමේ ක්‍රමයක් පාහේ විධිමත් සම්භාවිතා ආකෘතියක් ලෙස සකස් කළ හැකිය, එබැවින් මේ අර්ථයෙන් යන්ත්‍ර ඉගෙනීම සංඛ්‍යාලේඛනවලට බොහෝ සෙයින් සමාන ය, නමුත් එය සාමාන්‍යයෙන් පරාමිති ඇස්තමේන්තු (හුදෙක් පුරෝකථනය) ගැන නොසලකන අතර එය වෙනස් වේ. පරිගණක කාර්යක්ෂමතාව සහ විශාල දත්ත කට්ටල මත.
  • දත්ත කැණීම යනු (මම තේරුම් ගත් පරිදි) ව්‍යවහාරික යන්ත්‍ර ඉගෙනීමයි. විශාල දත්ත කට්ටල මත යන්ත්‍ර ඉගෙනීමේ ඇල්ගොරිතම යෙදවීමේ ප්‍රායෝගික අංශ කෙරෙහි එය වැඩි අවධානයක් යොමු කරයි. එය යන්ත්‍ර ඉගෙනීමට බෙහෙවින් සමාන ය.
  • කෘතිම බුද්ධිය යනු පරිගණකවල බුද්ධිය හා සම්බන්ධ ඕනෑම දෙයක් (අත්තනෝමතික ලෙස අර්ථ දැක්වීම) ය. ඉතින්, එයට බොහෝ දේ ඇතුළත් වේ .

පොදුවේ ගත් කල, සම්භාවිතා ආකෘති (සහ මේ අනුව සංඛ්‍යාලේඛන) යන්ත්‍රයක් තුළ දැනුම හා අවබෝධය විධිමත් ලෙස සැකසීමේ වඩාත් way ලදායී ක්‍රමය බව ඔප්පු වී ඇති අතර, අනෙක් තිදෙනාම (AI, ML සහ DM) අද බොහෝ දුරට උප ක්ෂේත්‍රයන් වේ. සංඛ්‍යාලේඛන. සංඛ්‍යාලේඛනවල සෙවනැලි හස්තයක් බවට පත්වූ පළමු විනය නොවේ ... (ආර්ථික විද්‍යාව, මනෝ විද්‍යාව, ජෛව තොරතුරු, ආදිය)


5
En කෙන් - ආර්ථික විද්‍යාවේ මනෝ විද්‍යාව හෝ AI සංඛ්‍යාලේඛනවල සෙවනැලි ආයුධ ලෙස හැඳින්වීම සාවද්‍ය වේ - මෙම ක්ෂේත්‍රයන් උනන්දුවක් දක්වන බොහෝ ගැටලු විශ්ලේෂණය කිරීම සඳහා සංඛ්‍යාලේඛන එක් එක් තුළ දැඩි ලෙස භාවිතා කළත්. වෛද්‍ය විද්‍යාව සෙවනැලි හස්තයක් යැයි යෝජනා කිරීමට ඔබට අවශ්‍ය නොවනු ඇත. බොහෝ වෛද්‍ය නිගමන දත්ත විශ්ලේෂණය මත දැඩි ලෙස රඳා පැවතුනද සංඛ්‍යාලේඛන.
mpacer

En කෙන් - මෙය හොඳ ප්‍රතිචාරයක් නමුත් AI වලින් සමන්විත අනෙක් දේවල් මොනවාදැයි ඔබට වඩාත් හොඳින් විස්තර කළ හැකිය. නිදසුනක් ලෙස, ically තිහාසිකව AI විසින් සම්භාවිතා නොවන ආකෘති විශ්ලේෂණයන් විශාල ප්‍රමාණයක් ඇතුළත් කර ඇත (උදා: නිෂ්පාදන පද්ධති, සෛලීය ස්වයංක්‍රීය යනාදිය. උදා: නිව්වෙල් සහ සයිමන් 1972 බලන්න). ඇත්ත වශයෙන්ම එවැනි සියලු ආකෘතීන් කිසියම් සම්භාවිතා ආකෘතියක අවස්ථා සීමා කරයි, නමුත් බොහෝ කලකට පසුව ඒවා එවැනි නහරයකින් විශ්ලේෂණය කර නොමැත.
mpacer

4
ඇල්ගොරිතම වඩාත් වේගවත් කිරීම සඳහා දත්ත ගබඩා කිරීම සහ සුචිගත කිරීම සිදු කරන ආකාරය සැබවින්ම සම්බන්ධ වන බැවින් දත්ත කැණීම යන්ත්‍ර ඉගෙනීමට වඩා වැඩි ය. එය බොහෝ දුරට AI, ML සහ සංඛ්‍යාලේඛන වලින් ක්‍රමවේදයන් ගැනීම සහ ඒවා කාර්යක්ෂම හා දක්ෂ දත්ත කළමනාකරණය සහ දත්ත පිරිසැලසුම් ශිල්පීය ක්‍රම සමඟ ඒකාබද්ධ කිරීම ලෙස සංලක්ෂිත කළ හැකිය. එය දත්ත කළමනාකරණයට සම්බන්ධ නොවන විට, ඔබට බොහෝ විට එය "යන්ත්‍ර ඉගෙනීම" ලෙස හැඳින්විය හැකිය. කෙසේ වෙතත් සමහර කාර්යයන් ඇත, විශේෂයෙන් "අධීක්ෂණය නොකළ", එහිදී "ඉගෙනීම" සම්බන්ධ නොවන අතර දත්ත කළමණාකරණයක් නොමැත, මේවා තවමත් "දත්ත කැණීම" (පොකුරුකරණය, පිටස්තර හඳුනාගැනීම) ලෙස හැඳින්වේ.
QUIT ඇත - Anony-Mousse

21

ඒවා සියල්ලම සම්බන්ධ බව අපට පැවසිය හැකිය, නමුත් ඒවා සියල්ලම වෙනස් දේවල් වේ. සංඛ්‍යාලේඛන හා දත්ත කැණීම් වැනි ඒවා අතර ඔබට පොදු දේවල් තිබිය හැකි වුවද, ඔබ පොකුරු ක්‍රම භාවිතා කරයි.
එක් එක් කෙටියෙන් අර්ථ දැක්වීමට මම උත්සාහ කරමි:

  • සංඛ්‍යාලේඛන යනු ප්‍රධාන වශයෙන් සම්භාව්‍ය ගණිතමය ක්‍රම මත පදනම් වූ ඉතා පැරණි විනයකි, සමහර විට දත්ත කැණීම යනු දේවල් වර්ගීකරණය හා කාණ්ඩගත කිරීම යන අරමුණු සඳහාම භාවිතා කළ හැකිය.

  • දත්ත කැණීම සමන්විත වන්නේ කරුණු හෝ සාධක ප්‍රමාණයක් ලබා දී ඇති අවස්ථා වර්ගීකරණය කිරීමට හෝ පුරෝකථනය කිරීමට අපට ඉඩ සලසන රටා හඳුනා ගැනීම සඳහා ගොඩනැගිලි ආකෘති වලින් ය.

  • කෘතිම බුද්ධිය (මර්වින් මින්ස්කි * පරීක්ෂා කරන්න) යනු ක්‍රමලේඛන ක්‍රම සමඟ මොළය ක්‍රියා කරන ආකාරය අනුකරණය කිරීමට උත්සාහ කරන විනයයි, උදාහරණයක් ලෙස චෙස් ක්‍රීඩා කරන වැඩසටහනක් ගොඩනැගීම.

  • යන්ත්‍ර ඉගෙනීම යනු දැනුම ගොඩනැගීම සහ එය කිසියම් ආකාරයකින් පරිගණකයේ ගබඩා කිරීමයි. එම ආකෘතිය ගණිතමය ආකෘති, ඇල්ගොරිතම යනාදිය විය හැකිය ... රටා හඳුනා ගැනීමට උපකාරී වන ඕනෑම දෙයක්.


2
නැත, නූතන AI බොහෝමයක් මුල් "මොළය අනුකරණය" කිරීමේ ප්‍රවේශය අනුගමනය නොකරයි. එය උපයෝගීතාව උපරිම කිරීම සඳහා පරිසරයක ක්‍රියා කරන “තාර්කික නියෝජිතයන්” නිර්මාණය කිරීම කෙරෙහි අවධානය යොමු කරන අතර යන්ත්‍ර ඉගෙනීමට වඩා සමීපව සම්බන්ධ වේ. රසල් සහ නොර්විග්ගේ පොත බලන්න.
nealmcb

1
ඔබේ අර්ථ දැක්වීමේදී එම්එල් සහ දත්ත කැණීම් අතර වෙනස මට නොපෙනේ
මාටින් තෝමා

16

යන්ත්‍ර ඉගෙනීම - දත්ත කැණීමේ අක්ෂය - මම වඩාත් හුරුපුරුදුය, එබැවින් මම ඒ පිළිබඳව අවධානය යොමු කරමි:

යන්ත්‍ර ඉගෙනීම ප්‍රමිතිගත නොවන අවස්ථාවන්හි අනුමාන කිරීම් කෙරෙහි උනන්දුවක් දක්වයි, නිදසුනක් ලෙස අයිඩී නොවන දත්ත, ක්‍රියාකාරී ඉගෙනීම, අර්ධ අධීක්ෂණය කරන ලද ඉගෙනීම, ව්‍යුහාත්මක දත්ත සමඟ ඉගෙනීම (උදාහරණයක් ලෙස නූල් හෝ ප්‍රස්තාර). ඉගෙන ගත හැකි දේ පිළිබඳ න්‍යායාත්මක සීමාවන් කෙරෙහි එම්එල් උනන්දු වන අතර එය බොහෝ විට භාවිතා කරන ඇල්ගොරිතම සඳහා පදනම සපයයි (උදා: ආධාරක දෛශික යන්ත්‍රය). එම්එල් බේසියානු ස්වභාවයට නැඹුරු වේ.

ඔබ දැනටමත් නොදන්නා දත්තවල රටා සොයා ගැනීමට දත්ත කැණීම උනන්දු වේ. සංඛ්‍යාලේඛනවල ගවේෂණාත්මක දත්ත විශ්ලේෂණයට වඩා එය සැලකිය යුතු ලෙස වෙනස් බව මට විශ්වාස නැත, යන්ත්‍ර ඉගෙනීමේදී සාමාන්‍යයෙන් විසඳීමට වඩා හොඳින් අර්ථ දක්වා ඇති ගැටළුවක් ඇත.

එම්එල් කුඩා දත්ත කට්ටල කෙරෙහි වැඩි උනන්දුවක් දක්වන අතර දත්ත ගැලපීම විශාල ප්‍රමාණයේ දත්ත කට්ටල කෙරෙහි උනන්දුවක් දක්වයි.

දත්ත පතල් කම්කරුවන් භාවිතා කරන මූලික මෙවලම් බොහොමයක් සංඛ්‍යාලේඛන හා යන්ත්‍ර ඉගෙනීම සපයයි.


"එම්එල් කුඩා දත්ත කට්ටල කෙරෙහි වැඩි උනන්දුවක් දක්වයි" සමඟ මම එකඟ නොවෙමි.
මාටින් තෝමා

කුඩා දත්ත කට්ටල සමඟ දත්ත කැණීම වඩාත් අපහසු වන්නේ එය ව්‍යාජ සංගමයක් සොයා ගැනීමේ අවස්ථාව වැඩි කරන හෙයිනි (සහ එය හඳුනා ගැනීමේ දුෂ්කරතාව වැඩි කරයි). හැකි තරම් තේරීම් කිහිපයක් කරන කුඩා දත්ත කට්ටල අනුමාන කිරීම් සමඟ වඩා ආරක්ෂිත වේ.
දික්රාන් අඟහරු

13

මෙන්න මම එය ගන්නවා. ඉතා පුළුල් කාණ්ඩ දෙකෙන් පටන් ගනිමු:

  • හුදෙක් පවා ඕනෑම දෙයක් මවා පානවා ස්මාර්ට් විය වේ කෘතිම බුද්ධි (එල් සහ දි.මු. ඇතුළුව).
  • දත්ත සාරාංශ කරන ඕනෑම දෙයක් සංඛ්‍යාලේඛන වේ , නමුත් ඔබ සාමාන්‍යයෙන් මෙය අදාළ කරන්නේ ප්‍රති results ල වලංගු භාවය කෙරෙහි අවධානය යොමු කරන ක්‍රමවේදයන්ට පමණි (බොහෝ විට එම්එල් සහ ඩීඑම් හි භාවිතා වේ)

එම්එල් සහ ඩීඑම් යන දෙකම සාමාන්‍යයෙන් AI සහ සංඛ්‍යාලේඛන යන දෙකම වේ. මෙන්න වෙනස්කම් කිහිපයක්:

  • දී යන්ත්රය ඉගෙනුම් , ඔබ තුළ ඇති හොඳින් අර්ථ අරමුණ (සාමාන්යයෙන් අනාවැකිය )
  • දී දත්ත පතල් , අත්යාවශ්යයෙන්ම ඔබ අරමුණ "ඇති මම දෙයක් ඒ නොවන දෙයක් දන්නවා "

මීට අමතරව, දත්ත කැණීමේදී සාමාන්‍යයෙන් බොහෝ දත්ත කළමනාකරණය ඇතුළත් වේ , එනම් කාර්යක්ෂම දර්ශක ව්‍යුහයන් සහ දත්ත සමුදායන් තුළ දත්ත සංවිධානය කරන්නේ කෙසේද.

අවාසනාවකට මෙන්, ඒවා වෙන් කිරීම එතරම් පහසු නැත. නිදසුනක් ලෙස, "අධීක්ෂණය නොකළ ඉගෙනීම" ඇත, එය බොහෝ විට එම්එල් වලට වඩා ඩීඑම් සමඟ වඩා සමීපව සම්බන්ධ වේ, එයට ඉලක්කය කරා ප්‍රශස්ත කළ නොහැකි බැවින්. අනෙක් අතට, දි.මු. ක්රම වෙනස් කිරීම අපහසු (කොහොමද ඔබ දන්නේ නැහැ අනුපාතය යමක්?) හා බොහෝ විට මත ඇගයීමට ලක් වේ එම සමහර තොරතුරු අතහැර, යන්ත්ර ෙලස කාර්යයන්. කෙසේ වෙතත්, මෙය සාමාන්‍යයෙන් සත්‍ය ඇගයීමේ ඉලක්කය කරා ප්‍රශස්ත කළ හැකි යන්ත්‍ර ඉගෙනීමේ ක්‍රමවලට වඩා නරක ලෙස ක්‍රියා කරන බව පෙනේ.

තවද, ඒවා බොහෝ විට සංයෝජනයන්හි භාවිතා වේ. නිදසුනක් ලෙස, දත්ත පෙර සැකසුම් කිරීම සඳහා දත්ත කැණීමේ ක්‍රමයක් (කියන්න, පොකුරුකරණය හෝ අධීක්ෂණය නොකළ බාහිර හඳුනාගැනීම) භාවිතා කරයි, පසුව වඩා හොඳ වර්ගීකරණයක් පුහුණු කිරීම සඳහා පෙර සැකසූ දත්ත මත යන්ත්‍ර ඉගෙනීමේ ක්‍රමය යොදා ගැනේ.

යන්ත්‍ර ඉගෙනීම සාමාන්‍යයෙන් ඇගයීමට වඩා පහසු ය: ලකුණු හෝ පන්ති පුරෝකථනය වැනි ඉලක්කයක් ඇත. ඔබට නිරවද්යතාව ගණනය කර නැවත මතක් කළ හැකිය. දත්ත කැණීමේදී, බොහෝ ඇගයීම් සිදු කරනු ලබන්නේ යම් තොරතුරු (පන්ති ලේබල් වැනි) අතහැර දමා ඔබේ ක්‍රමය එකම ව්‍යුහයක් සොයා ගත්තේද යන්න පරීක්ෂා කිරීමෙනි. පංති ලේබල් මඟින් දත්තවල ව්‍යුහය මුළුමනින්ම සංකේතවත් කරයි යැයි ඔබ උපකල්පනය කරන පරිදි මෙය අර්ථයෙන් බොළඳ ය; ඔබේ දත්තවල නව දෙයක් සොයා ගන්නා දත්ත කැණීමේ ඇල්ගොරිතමයට ඔබ සැබවින්ම ද punish ුවම් කරයි. - වක්‍රව - එය තක්සේරු කිරීමේ තවත් ක්‍රමයක් නම්, සොයාගත් ව්‍යුහය සත්‍ය එම්එල් ඇල්ගොරිතමයේ ක්‍රියාකාරිත්වය වැඩි දියුණු කරන ආකාරයයි (උදා: දත්ත කොටස් කිරීමේදී හෝ පිටස්තරයින් ඉවත් කිරීමේදී). තවමත්, මෙම ඇගයීම පදනම් වී ඇත්තේ පවත්නා ප්‍රති results ල ප්‍රතිනිෂ්පාදනය කිරීම මත වන අතර එය ඇත්ත වශයෙන්ම දත්ත කැණීමේ පරමාර්ථය නොවේ ...


1
ඔබේ ප්‍රතිචාරය ඉතා බුද්ධිමත් ය. එම්එල් හි කාර්යසාධනය තක්සේරු කිරීමේ සහ ඩීඑම් හි කාර්යසාධනය ඇගයීමේ වෙනස්කම් ගැන මම අවසාන ඡේදය විශේෂයෙන් අගය කරමි.
justis

8

කියූ දෙයට මම නිරීක්ෂණ කිහිපයක් එකතු කරමි ...

AI යනු කිසියම් කාර්යයක් සැලසුම් කිරීම හෝ වෙනත් ආයතන සමඟ සහයෝගයෙන් කටයුතු කිරීම, ඇවිදීමට අත් පා ක්‍රියාත්මක කිරීමට ඉගෙනීම දක්වා තර්කානුකූලව හෝ හැඟීම්බර ලෙස පෙනෙන ක්‍රියාකාරකම් කරන යන්ත්‍ර සමඟ සම්බන්ධ ඕනෑම දෙයකට ඉතා පුළුල් යෙදුමකි. ඉතා වැදගත් අර්ථ දැක්වීමක් නම් AI යනු පරිගණකයට සම්බන්ධ ඕනෑම දෙයක් වන අතර එය තවමත් හොඳින් කරන්නේ කෙසේදැයි අපි නොදනිමු. (එය හොඳින් කරන්නේ කෙසේදැයි අප දැනගත් පසු, එය සාමාන්‍යයෙන් එහි නමක් ලබා ගන්නා අතර එය තවදුරටත් "AI" නොවේ.)

විකිපීඩියාවට පටහැනිව, රටා හඳුනාගැනීම සහ යන්ත්‍ර ඉගෙනීම එකම ක්ෂේත්‍රයක් බව මගේ හැඟීමයි. නමුත් කලින් සඳහන් කළ දේ පරිගණක විද්‍යා people යන් විසින් සිදු කරනු ලබන අතර දෙවැන්න සංඛ්‍යාන ians යින් සහ ඉංජිනේරුවන් විසින් ක්‍රියාත්මක කරනු ලැබේ. (බොහෝ තාක්ෂණික ක්ෂේත්‍ර විවිධ උප කණ්ඩායම් විසින් නැවත නැවතත් සොයා ගනු ලැබේ, ඔවුන් බොහෝ විට තමන්ගේම භාෂාව සහ මානසිකත්වය මේසය වෙත ගෙන එයි.)

දත්ත කැණීම කෙසේ වෙතත්, යන්ත්‍ර ඉගෙනීම / රටා හඳුනාගැනීම (දත්ත සමඟ වැඩ කරන ශිල්පීය ක්‍රම) ගෙන ඒවා දත්ත සමුදාය, යටිතල පහසුකම් සහ දත්ත වලංගු කිරීම / පිරිසිදු කිරීමේ ක්‍රමවේදයන් ඔතා.


6
යන්ත්‍ර ඉගෙනීම සහ රටා හඳුනා ගැනීම එකම දෙයක් නොවේ, යන්ත්‍ර ඉගෙනීම ද ප්‍රතිගාමීත්වය සහ හේතුකාරක අනුමානය වැනි දේ කෙරෙහි උනන්දුවක් දක්වයි. රටා හඳුනාගැනීම යන්ත්‍ර ඉගෙනීමට ඇති උනන්දුව පිළිබඳ එක් ගැටළුවක් පමණි. මා දන්නා යන්ත්‍ර ඉගෙනීමේ බොහෝ දෙනා පරිගණක විද්‍යා අංශවල සිටිති.
ඩික්රාන් අඟහරු

2
Ik දික්රාන් එකඟ වන නමුත් එම්එල් සහ පීආර් බොහෝ විට අන්වර්ථ කර දත්ත විශ්ලේෂණයේ සමාන මාතෘකා යටතේ ඉදිරිපත් කරනු ලැබේ. මගේ ප්‍රියතම පොත ක්‍රිස්ටෝෆ් එම් බිෂොප්ගේ රටා හඳුනාගැනීම සහ යන්ත්‍ර ඉගෙනීමයි. මෙන්න JSS ජෝන් MainDonald විසින් විශ්ලේෂණයකි j.mp/etg3w1 .
chl

සීඑස් ලෝකයේ “රටා හඳුනාගැනීම” ට වඩා “යන්ත්‍ර ඉගෙනීම” යන වචනය බොහෝ සෙයින් පොදු බව මට හැඟේ.
bayerj

එම්එල් යනු සීඑස් යෙදුමකි.
කාල් මොරිසන්

3

කනගාටුවට කරුණක් නම්, මෙම ප්‍රදේශ අතර වෙනස බොහෝ දුරට ඔවුන් උගන්වන ස්ථානයයි: සංඛ්‍යාලේඛන පදනම් වී ඇත්තේ ගණිත දෙපාර්තමේන්තු, අයි, පරිගණක විද්‍යා දෙපාර්තමේන්තු වල යන්ත්‍ර ඉගෙනීම සහ දත්ත කැණීම වඩාත් අදාළ වේ (ව්‍යාපාරික හෝ අලෙවිකරණ දෙපාර්තමේන්තු විසින් භාවිතා කරනු ලැබේ, මෘදුකාංග සමාගම් විසින් සංවර්ධනය කරන ලදි) .

පළමුවෙන්ම AI (එය ඕනෑම බුද්ධිමත් පද්ධතියක් අදහස් කළ හැකි වුවද) සම්ප්‍රදායිකව සංඛ්‍යානමය තක්සේරුවට වඩා තර්කනය පදනම් කරගත් ප්‍රවේශයන් (උදා: විශේෂ expert පද්ධති) අදහස් කරයි. ගණිත දෙපාර්තමේන්තු මත පදනම් වූ සංඛ්‍යාලේඛන ඉතා හොඳ න්‍යායාත්මක අවබෝධයක් ලබා ඇති අතර පර්යේෂණාත්මක විද්‍යාවන්හි ප්‍රබල ව්‍යවහාරික අත්දැකීම් සමඟ පැහැදිලි විද්‍යාත්මක ආකෘතියක් ඇති අතර පවතින සීමිත පර්යේෂණාත්මක දත්ත සමඟ කටයුතු කිරීමට සංඛ්‍යාලේඛන අවශ්‍ය වේ. බොහෝ විට අවධානය යොමු වී ඇත්තේ ඉතා කුඩා දත්ත කට්ටල වලින් උපරිම තොරතුරු මිරිකීම සඳහා ය. තවද ගණිතමය සාධනයන් කෙරෙහි නැඹුරුවක් ඇත: ඔබේ ප්‍රවේශය පිළිබඳ කරුණු ඔප්පු කිරීමට ඔබට නොහැකි නම් ඔබ ප්‍රකාශයට පත් නොකෙරේ. විශ්ලේෂණය ස්වයංක්‍රීය කිරීම සඳහා පරිගණක භාවිතා කිරීමේදී සංඛ්‍යාලේඛන පසුගාමී වී ඇති බව මින් අදහස් වේ. යළි, ක්‍රමලේඛන දැනුම නොමැතිකම නිසා සංඛ්‍යාලේඛන ians යින්ට පරිගණකමය ගැටලු වැදගත් වන මහා පරිමාණ ගැටලු විසඳීමට නොහැකි වී ඇත (GPU සහ හදූප් වැනි බෙදා හරින ලද පද්ධති සලකා බලන්න). ජෛව තොරතුරු තාක්‍ෂණය වැනි අංශ දැන් සංඛ්‍යාලේඛන මෙම දිශාවට ගෙන ගොස් ඇති බව මම විශ්වාස කරමි. අවසාන වශයෙන් මම කියන්නේ සංඛ්‍යාලේඛන ians යින් වඩාත් සැක සහිත පොකුරක් බවයි: ඔබ සංඛ්‍යාලේඛන සමඟ දැනුම සොයා ගත් බව ඔවුන් නොකියයි - ඒ වෙනුවට විද්‍යා ist යෙක් උපකල්පනයක් ඉදිරිපත් කරයි, සංඛ්‍යාලේඛන ician යාගේ කාර්යය වන්නේ උපකල්පිතයට දත්ත මගින් සහය ලැබේද යන්න පරීක්ෂා කිරීමයි. යන්ත්‍ර ඉගෙනීම සීඑස් දෙපාර්තමේන්තු වල උගන්වනු ලබන අතර, අවාසනාවකට සුදුසු ගණිතය උගන්වන්නේ නැත: බහුකාර්ය ගණනය කිරීම්, සම්භාවිතාව, සංඛ්‍යාලේඛන සහ ප්‍රශස්තිකරණය සාමාන්‍ය දෙයක් නොවේ ... යමෙකුට උදාහරණ වලින් ඉගෙනීම වැනි නොපැහැදිලි 'චමත්කාරජනක' සංකල්ප තිබේ ...සංඛ්යානමය ඉගෙනුම් පිටුව 30 හි මූලද්රව්ය. මෙයින් අදහස් කරන්නේ න්‍යායාත්මක අවබෝධයක් නොමැති අතර ඇල්ගොරිතම පුපුරා යාමක් පර්යේෂකයන්ට සෑම විටම ඔවුන්ගේ ඇල්ගොරිතම වඩා හොඳ බව ඔප්පු කරන දත්ත කට්ටලයක් සොයා ගත හැකි බවයි. එම්එල් පර්යේෂකයන් ඊළඟ විශාල දෙය පසුපස හඹා යන විට අතිශයෝක්තියෙන් යුත් අදියරයන් ඇත: ස්නායුක ජාල, ගැඹුරු ඉගෙනීම යනාදිය. අවාසනාවකට සීඑස් දෙපාර්තමේන්තු තුළ වැඩි මුදලක් තිබේ (ගූගල්, මයික්‍රොසොෆ්ට් සහ වඩා අලෙවිකරණ 'ඉගෙනීම' සමඟ සිතන්න) එබැවින් වඩාත් සැක සහිත සංඛ්‍යාලේඛන ians යින් නොසලකා හරිනු ලැබේ. අවසාන වශයෙන්, ආනුභවවාදී නැමීමක් ඇත: මූලික වශයෙන් ඔබ ඇල්ගොරිතමයට ප්‍රමාණවත් දත්ත විසි කළහොත් එය නිවැරදි අනාවැකි 'ඉගෙන ගනු' ඇතැයි යටි විශ්වාසයක් ඇත. මම එම්එල්ට පක්ෂග්‍රාහීව සිටියදී, සංඛ්‍යාලේඛන ians යින් විසින් නොසලකා හරින ලද එම්එල් හි මූලික අවබෝධයක් ඇත: පරිගණකවලට සංඛ්‍යාලේඛන යෙදීමෙහි විප්ලවීය වෙනසක් කළ හැකිය.

ක්‍රම දෙකක් තිබේ- අ) සම්මත පරීක්ෂණ සහ ආකෘති යෙදීම ස්වයංක්‍රීය කිරීම. උදා: ආකෘති බැටරියක් ධාවනය කිරීම (රේඛීය ප්‍රතිගාමීත්වය, අහඹු වනාන්තර ආදිය. විවිධ යෙදවුම්, පරාමිති සැකසුම් ආදිය උත්සාහ කරයි). මෙය සැබවින්ම සිදුවී නැත - කාගල් හි තරඟකරුවන් තමන්ගේම ස්වයංක්‍රීයකරණ ක්‍රමවේදයන් දියුණු කරයි යැයි මම සැක කළද. ආ) විශාල සංඛ්‍යාලේඛන සඳහා සම්මත සංඛ්‍යාන ආකෘති යෙදීම: උදා: ගූගල් පරිවර්තනය, නිර්දේශ පද්ධති යනාදිය ගැන සිතන්න (උදා: මිනිසුන් එවැනි පරිවර්තනයක් හෝ නිර්දේශ කිරීමක් යැයි කිසිවෙකු කියා සිටින්නේ නැත. යටින් පවතින සංඛ්‍යානමය ආකෘතීන් සරල නමුත් බිලියන ගණනක් දත්ත ලක්ෂ්‍යයන්ට මෙම ක්‍රම යොදා ගැනීමේදී දැවැන්ත පරිගණක ගැටළු තිබේ.

දත්ත කැණීම මෙම දර්ශනයේ කූටප්‍රාප්තියයි ... දත්ත වලින් දැනුම ලබා ගැනීමේ ස්වයංක්‍රීය ක්‍රම සංවර්ධනය කිරීම. කෙසේ වෙතත්, එය වඩාත් ප්‍රායෝගික ප්‍රවේශයක් ඇත: අත්‍යවශ්‍යයෙන්ම එය චර්යාත්මක දත්ත සඳහා යොදා ගැනේ, එහිදී විද්‍යාත්මක න්‍යායක් (අලෙවිකරණය, වංචා හඳුනා ගැනීම, අයාචිත තැපැල් යනාදිය) නොමැති අතර විශාල දත්ත ප්‍රමාණයක් විශ්ලේෂණය ස්වයංක්‍රීය කිරීම මෙහි අරමුණයි: සැකයක් නැත සංඛ්‍යාලේඛන ians යින්ට ප්‍රමාණවත් කාලයක් ලබා දී වඩා හොඳ විශ්ලේෂණයක් ඉදිරිපත් කළ හැකි නමුත් පරිගණකයක් භාවිතා කිරීම වඩා ලාභදායී වේ. ඩී. හෑන්ඩ් පැහැදිලි කරන පරිදි එය secondary න පර්යේෂණාත්මක සැලසුමක විද්‍යාත්මක ප්‍රශ්නයකට පිළිතුරු සැපයීම සඳහා පැහැදිලිව එකතු කර ඇති දත්තවලට වඩා ද්විතීයික දත්ත විශ්ලේෂණය වේ. දත්ත කැණීමේ සංඛ්‍යාලේඛන සහ තවත් බොහෝ දේ, ඩී හෑන්ඩ්

එබැවින් සාම්ප්‍රදායික AI යනු සංඛ්‍යානවලට වඩා තර්කනය මත පදනම් වූවක් බවත්, යන්ත්‍ර ඉගෙනීම න්‍යායෙන් තොර සංඛ්‍යාලේඛන බවත් සංඛ්‍යාලේඛන 'පරිගණක රහිත සංඛ්‍යාලේඛන' බවත්, දත්ත කැණීම යනු අවම පරිශීලක මැදිහත්වීමකින් සංඛ්‍යානමය විශ්ලේෂණය සඳහා ස්වයංක්‍රීය මෙවලම් සංවර්ධනය කිරීම බවත් මම සාරාංශ කරමි.


මෙම පිළිතුර බොහෝ සෙයින් වෙනස් වන අතර එය අනුගමනය කිරීම අසීරු වන අතර අනවශ්‍ය ලෙස දිගු වේ, නමුත් එය සැබවින්ම වෙනසකට වඩා විනයානුකූල සම්ප්‍රදායන් හා අවධාරණයන් සියල්ලටම වඩා ඇති බව සලකුණු කරයි.
ත්‍රෛපාර්ශවීය

1

දත්ත කැණීම යනු සැඟවුණු රටා හෝ නොදන්නා දැනුම සොයා ගැනීමයි, එය මිනිසුන්ට තීරණ ගැනීම සඳහා භාවිතා කළ හැකිය.

යන්ත්‍ර ඉගෙනීම යනු නව වස්තු වර්ගීකරණය කිරීම සඳහා ආකෘතියක් ඉගෙනීමයි.


යන්ත්රය ඉගෙන පමණක් වර්ගීකරණය ගැන? යන්ත්‍ර ඉගෙනීම වෙනත් අරමුණු සඳහා භාවිතා කළ නොහැකිද?
gung - මොනිකා නැවත

නියත වශයෙන්ම නැත. ශක්තිමත් කිරීමේ ඉගෙනීම යනු අයිඑම්එච්ඕ, එම්එල් හි වඩාත්ම ලාක්ෂණික උප ක්‍ෂේත්‍රය වන අතර එය වර්ගීකරණය මත නොව ඉලක්ක සපුරා ගැනීම මත යැයි මම නොකියමි.
nbro

1
එන්බ්‍රෝ, එම ප්‍රකාශය ඔවුන් එම්එල් නිර්වචනය කළේ කෙතරම් පටු දැයි නැවත සලකා බැලීමට OP ට ඉඟියක් විය යුතුය.
gung - මොනිකා නැවත

0

මගේ මතය අනුව, කෘතිම බුද්ධිය යන්ත්‍ර ඉගෙනීම, දත්ත කැණීම, රටා හඳුනාගැනීම වැනි ක්ෂේත්‍රවල “සුපර්සෙට්” ලෙස සැලකිය හැකිය.

  • සංඛ්‍යාලේඛන යනු AI හි භාවිතා වන සියලුම ගණිතමය ආකෘතීන්, ශිල්පීය ක්‍රම සහ ප්‍රමේයයන් ඇතුළත් වන ගණිත ක්ෂේත්‍රයකි.

  • යන්ත්‍ර ඉගෙනීම යනු AI හි ක්ෂේත්‍රයක් වන අතර එය ඉහත සඳහන් සංඛ්‍යාන ආකෘති වලට අදාළ වන සියලුම දත්ත ඇල්ගොරිතම ඇතුළත් වන අතර දත්ත පිළිබඳ හැඟීමක් ඇති කරයි, එනම් පොකුරුකරණය සහ වර්ගීකරණය වැනි පුරෝකථන විශ්ලේෂණ.

  • දත්ත කැණීම යනු දත්ත වලින් ප්‍රයෝජනවත් හා වැදගත් රටා උකහා ගැනීම සඳහා ඉහත සියළු ශිල්පීය ක්‍රම (යන්ත්‍ර ඉගෙනීම ප්‍රධාන වශයෙන්) භාවිතා කරන විද්‍යාවයි. දත්ත කැණීම සාමාන්‍යයෙන් කළ යුත්තේ දැවැන්ත දත්ත කට්ටල වලින්, එනම් විශාල දත්ත වලින් ප්‍රයෝජනවත් තොරතුරු ලබා ගැනීමයි.


0

කලින් පිළිතුරු වලට නිසි ගෞරවයෙන් යුතුව, පිළිතුරේ විශාල කොටසක් තවමත් අතුරුදහන් වී ඇති බවත් එය අපගේ ඇස් ඉදිරිපිට ඇති බවත් මම විශ්වාස කරමි. මට එය අත්හදා බැලීමට ඉඩ දෙන්න:

දත්ත පතල් දී, හුදෙක් නම ශබ්ද මෙන්, ඔබ අඩුව පුරවන දත්ත. දැන් පතල් කැණීම යනු එයින් දැනුම ලබා ගැනීම පමණක් නොව, සාමාන්‍යයෙන් එයින් අදහස් වන්නේ ඔබ ජැකාර්ඩ් දර්ශකය වැනි දත්තවල යම් මිනුම් හෝ සංඛ්‍යාලේඛන ගණනය කරන බවයි.

යන්ත්‍ර ඉගෙනීමේදී, ඔබ මගේ හෝ උපුටා ගැනීම පමණක් නොව , ඔබ ඉගෙන ගනී. දැන් ඉගෙනීමේ න්‍යායට සංඛ්‍යාලේඛනවල මූලයන් ඇත, නමුත් ඊට වඩා එය ගෙන යයි. ඉගෙනීමේදී, ඔබට සීමිත නියැදි දත්ත මත පදනම්ව ඉගෙන ගන්නා කාර්යයක් ඇති අතර එය නොපෙනෙන දත්ත සාමාන්‍යකරණය කළ හැකිය. සෑම රූපයකටම නව පසුබිමක්, නව වයනය සහ වෙනත් දේ තිබුණද ඔබගේ ෆේස්බුක් රූප නැවත සකස් කිරීම මඟින් ඔබගේ ඡායාරූපයෙහි ඔබව ටැග් කළ හැකිය. මෙම ගැටළුව සම්බන්ධයෙන් ඔබට කිසිදු දත්ත කැණීමේ ප්‍රවේශයක් භාවිතා කළ නොහැක.

කෘතිම බුද්ධියේදී, ඔබ අනිවාර්යයෙන්ම මැෂින් ලෙනින් වැනි දත්ත වලින් ඉගෙන ගන්නවා, නමුත් සැලසුම් කිරීම වැනි තවත් ඉහළ මට්ටමේ කාර්යයන් ඉටු කිරීමට ඔබට අවශ්‍යය. ඔබ ඉගෙන ගත් දේ මත පදනම්ව ප්‍රතිපත්ති සොයා ගත යුතු අතර, ඊට වඩා එය රැගෙන යන්න. හොඳ චලනයන් ඉගෙන ගැනීමෙන් ඔබට චෙස් ක්‍රීඩාවක් හෝ ක්‍රීඩාවක් කළ නොහැක, සෑම ක්‍රීඩාවක්ම නව ක්‍රීඩාවක් වුවද, තවත් ක්‍රීඩාවක් නොමැති වුවද, ජයග්‍රහණය සඳහා වැඩි අවස්ථාවක් ලබා දෙන හොඳ ආරම්භක ස්ථානයක් වැනි ප්‍රතිපත්ති සොයා ගැනීම ආරම්භ කළ යුතුය. ක්‍රීඩාව එකම චලනයන් අනුගමනය කරනු ඇත.


-1

කෙසේද: ඉගෙනීමට යන්ත්‍ර ඉගැන්වීම

දත්තවල අර්ථවත් රටාවන් හඳුනා ගන්න: දත්ත කැණීම

දන්නා රටාවන්ගෙන් ප්‍රති come ල පුරෝකථනය කරන්න: එම්.එල්

අමු දත්ත නැවත සකස් කිරීම සඳහා නව විශේෂාංග සොයා ගන්න: AI

මෙම පක්ෂි මොළයට සැබවින්ම සරල අර්ථ දැක්වීම් අවශ්‍ය වේ.


-1

බොහෝ විට දත්ත කැණීම මඟින් අනාගත දත්ත "අනාවැකි කීමට" හෝ යමක් සිදුවීමට හේතුව "පැහැදිලි කිරීමට" උත්සාහ කරයි.

මගේ ඇස්වල උපකල්පිතය වලංගු කිරීම සඳහා සංඛ්‍යාලේඛන වැඩිපුර භාවිතා වේ. නමුත් මෙය ආත්මීය සාකච්ඡාවකි.

සංඛ්‍යාලේඛන ians යින් සහ දත්ත පතල් කම්කරුවන් අතර ඇති එක් පැහැදිලි වෙනසක් ඔවුන් දෙස බලන සාරාංශ සංඛ්‍යාලේඛනවලින් සොයාගත හැකිය.

සංඛ්‍යාලේඛන බොහෝ විට තමන් R² හා නිරවද්‍යතාවයට සීමා කරනු ඇති අතර දත්ත පතල් කම්කරුවන් AUC, ROC වක්‍ර, සෝපාන වක්‍ර ආදිය දෙස බලනු ඇති අතර පිරිවැය ආශ්‍රිත නිරවද්‍යතා වක්‍රය භාවිතා කිරීමෙන් ද සැලකිලිමත් විය හැකිය.

දත්ත කැණීමේ පැකේජ (නිදසුනක් ලෙස විවෘත මූලාශ්‍ර වේකා), ආදාන තේරීම, ආධාරක දෛශික යන්ත්‍ර වර්ගීකරණය යනාදිය සඳහා තාක්‍ෂණික ක්‍රමවේදයන් තුළ ගොඩනගා ඇති අතර මේවා බොහෝ දුරට ජේඑම්පී වැනි සංඛ්‍යානමය පැකේජවල නොමැත. මම මෑතකදී jmp ජනයාගෙන් "jmp හි දත්ත කැණීම" පිළිබඳ පා course මාලාවක් හැදෑරූ අතර එය දෘශ්‍යමය වශයෙන් ශක්තිමත් පැකේජයක් වුවද සමහර අත්‍යවශ්‍ය දත්ත කැණීම් පෙර / පසු / මැද ක්‍රමවේදයන් අතුරුදහන්. ආදාන තේරීම අතින් සිදු කරන ලදි, දත්ත පිළිබඳ අවබෝධයක් ලබා ගැනීම සඳහා, තවමත් දත්ත කැණීමේදී, ඇල්ගොරිතම, බුද්ධිමත්ව, විශාල දත්ත මත මුදා හැරීම සහ එළියට එන දේ ස්වයංක්‍රීයව බැලීම ඔබේ අභිප්‍රාය පමණි. මෙම පා course මාලාව පැහැදිලිවම සංඛ්‍යාලේඛන පුද්ගලයින් විසින් උගන්වන ලද අතර එමඟින් දෙදෙනා අතර වෙනස් මානසිකත්වයක් අවධාරණය කෙරිණි.

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.