ඒකක පරීක්ෂාව ඔබේ මිතුරා ය
ලේඛකයින් අතර කියමනක් තිබේ “සියලු ලිවීම් නැවත ලිවීම” - එනම් ලිවීමේ වැඩි කොටසක් සංශෝධනය කිරීමයි. ක්රමලේඛකයින් සඳහා (හෝ අවම වශයෙන් දත්ත විද්යා scientists යින්) ප්රකාශනය "සියලු කේතීකරණය නිදොස්කරණය කිරීම" ලෙස නැවත අර්ථ දැක්විය හැකිය.
ඔබ කේතය ලියන ඕනෑම වේලාවක එය අපේක්ෂිත පරිදි ක්රියාත්මක වන බව තහවුරු කර ගත යුතුය. නිරවද්යතාවය සත්යාපනය සඳහා මා මෙතෙක් සොයාගෙන ඇති හොඳම ක්රමය නම් ඔබේ කේතය කුඩා කොටස් වලට කැඩීම සහ එක් එක් කොටස ක්රියාත්මක වන බව තහවුරු කිරීමයි. ඛණ්ඩයේ ප්රතිදානය නිවැරදි පිළිතුර ලෙස ඔබ දන්නා දේ සමඟ සංසන්දනය කිරීමෙන් මෙය කළ හැකිය. මෙය ඒකක පරීක්ෂණ ලෙස හැඳින්වේ . හොඳ ඒකක පරීක්ෂණ ලිවීම හොඳ සංඛ්යාලේඛන ian යෙකු / දත්ත විද්යා ist යෙකු / යන්ත්ර ඉගෙනීමේ විශේෂ expert යෙකු / ස්නායුක ජාල වෘත්තිකයෙකු වීමේ ප්රධාන අංගයකි. සරලවම ආදේශකයක් නොමැත.
ජාල ක්රියාකාරිත්වය සුසර කිරීමට පෙර ඔබේ කේතය දෝෂ වලින් තොර දැයි ඔබ පරීක්ෂා කළ යුතුය! එසේ නොමැතිනම්, ඔබ ආර්එම්එස් ටයිටැනික් නෞකාවේ තට්ටු පුටු නැවත සකස් කිරීමද විය හැකිය .
ස්නායුක ජාල වල විශේෂාංග දෙකක් තිබේ, එය වෙනත් වර්ගවල යන්ත්ර ඉගෙනීමට හෝ සංඛ්යාන ආකෘතිවලට වඩා සත්යාපනය වඩාත් වැදගත් කරයි.
ස්නායුක ජාලයන් අහඹු වනාන්තර හෝ ලොජිස්ටික් ප්රතිගාමී ආකාරයෙන් ඇල්ගොරිතම නොවේ. සරල, පෝෂක-ඉදිරි ජාල සඳහා වුවද, ජාලය වින්යාසගත කර ඇති ආකාරය, සම්බන්ධ කර ඇති, ආරම්භක සහ ප්රශස්ත කර ඇති ආකාරය පිළිබඳ තීරණ ගැනීමට පරිශීලකයාගේ වගකීම බොහෝ දුරට ඇත. මෙයින් අදහස් කරන්නේ කේතය ලිවීම සහ කේතය ලිවීම යනු නිදොස්කරණය කිරීමයි.
ව්යතිරේකයක් මතු නොකර ස්නායුක ජාල කේතයක් ක්රියාත්මක වූවත්, ජාලයට තවමත් දෝෂ තිබිය හැකිය! මෙම දෝෂයන් ජාලය පුහුණු කරන ද්රෝහී ආකාරයක් විය හැකි නමුත් උප ප්රශස්ත විසඳුමක සිරවී හෝ ප්රති ing ලයක් ලෙස ඇති ජාලයට අපේක්ෂිත ගෘහ නිර්මාණ ශිල්පය නොමැත. ( මෙය සින්ටැක්ටික් හා අර්ථකථන දෝෂයක් අතර වෙනස සඳහා උදාහරණයකි .)
චේස් රොබට්ස් විසින් රචිත " යන්ත්ර යන්ත්ර ඉගෙනීමේ කේතය ඒකක කරන්නේ කෙසේද " යන මෙම මධ්යම පෝස්ට් මඟින් යන්ත්ර ඉගෙනුම් ආකෘති සඳහා ඒකක පරීක්ෂා කිරීම වඩාත් විස්තරාත්මකව සාකච්ඡා කරයි. දෝෂ සහිත කේතයේ මෙම උදාහරණය මම ලිපියෙන් ලබා ගත්තෙමි:
def make_convnet(input_image):
net = slim.conv2d(input_image, 32, [11, 11], scope="conv1_11x11")
net = slim.conv2d(input_image, 64, [5, 5], scope="conv2_5x5")
net = slim.max_pool2d(net, [4, 4], stride=4, scope='pool1')
net = slim.conv2d(input_image, 64, [5, 5], scope="conv3_5x5")
net = slim.conv2d(input_image, 128, [3, 3], scope="conv4_3x3")
net = slim.max_pool2d(net, [2, 2], scope='pool2')
net = slim.conv2d(input_image, 128, [3, 3], scope="conv5_3x3")
net = slim.max_pool2d(net, [2, 2], scope='pool3')
net = slim.conv2d(input_image, 32, [1, 1], scope="conv6_1x1")
return net
ඔබ දෝෂය දකිනවාද? විවිධ මෙහෙයුම් බොහොමයක් ඇත්ත වශයෙන්ම භාවිතා නොවේපෙර ප්රති results නව විචල්යයන් සමඟ අධික ලෙස ලියා ඇති නිසා . ජාලයක මෙම කේත කොටස භාවිතා කිරීම තවමත් පුහුණු වන අතර බර යාවත්කාලීන වන අතර අලාභය පවා අඩු විය හැකිය - නමුත් කේතය නිසැකවම අදහස් කළ දේ නොකරයි. (කතුවරයා තනි හෝ ද්වි-උපුටා දැක්වීම් භාවිතා කිරීමට ද නොගැළපෙන නමුත් එය තනිකරම ශෛලීය ය.)
ස්නායුක ජාල වලට අදාළ වඩාත් පොදු ක්රමලේඛන දෝෂ වේ
- විචල්යයන් නිර්මාණය කර ඇති නමුත් කිසි විටෙක භාවිතා නොකෙරේ (සාමාන්යයෙන් පිටපත්-පේස්ට් දෝෂ නිසා);
- ශ්රේණියේ යාවත්කාලීන කිරීම් සඳහා ප්රකාශන වැරදිය;
- බර යාවත්කාලීන කිරීම් අදාළ නොවේ;
- පාඩු ශ්රිත නිවැරදි පරිමාණයෙන් මනිනු නොලැබේ (නිදසුනක් ලෙස, හරස් එන්ට්රොපි අලාභය සම්භාවිතාව හෝ ලොගයන් අනුව ප්රකාශ කළ හැකිය)
- අලාභය කාර්යය සඳහා සුදුසු නොවේ (නිදසුනක් ලෙස, ප්රතිගාමී කාර්යයක් සඳහා වර්ගීකරණ හරස් එන්ට්රොපි පාඩුව භාවිතා කිරීම).
ඔබ ඇවිදීමට පෙර බඩගා යන්න; ඔබ දුවන්නට පෙර ඇවිදින්න
පුළුල් හා ගැඹුරු ස්නායුක ජාල සහ විදේශීය රැහැන් සහිත ස්නායුක ජාල දැන් යන්ත්ර ඉගෙනීමේ උණුසුම් දෙයයි. නමුත් මෙම ජාලයන් සම්පූර්ණයෙන් පිහිටුවා නොතිබුණි. ඔවුන්ගේ නිර්මාණකරුවන් කුඩා ඒකක වලින් ඔවුන් වෙත ගොඩනගා ඇත. පළමුව, තනි සැඟවුණු තට්ටුවක් සහිත කුඩා ජාලයක් ගොඩනඟා එය නිවැරදිව ක්රියාත්මක වන බව තහවුරු කරගන්න. ඉන්පසු අමතර ආකෘති සංකීර්ණතාවයන් වැඩි කරන්න, තවද ඒ සෑම එකක්ම ක්රියාත්මක වන බව තහවුරු කරගන්න.
නියුරෝන ඉතා ස්වල්පයක් ස්තරයක ඇති මඟින් ජාලය ඉගෙන ගන්නා නිරූපණය සීමා කළ හැකි අතර එමඟින් නොගැලපේ. නියුරෝන ඕනෑවට වඩා ගැළපීමට හේතු විය හැකි බැවින් ජාලය පුහුණු දත්ත "කටපාඩම්" කරයි.
ගණිතමය වශයෙන් ගැටළුවක් නිරූපණය කිරීමට අවශ්ය වන්නේ නියුරෝන ඉතා සුළු සංඛ්යාවක් පමණක් බව ඔබට ඔප්පු කළ හැකි වුවද, බොහෝ විට සිදුවන්නේ “තවත්” නියුරෝන කිහිපයක් තිබීම ප්රශස්තකරණයට “හොඳ” වින්යාසයක් සොයා ගැනීම පහසු කරයි . (නමුත් මෙය සිදුවන්නේ මන්දැයි කිසිවෙකු සම්පූර්ණයෙන් තේරුම් ගනී යැයි මම නොසිතමි.) මෙහි XOR ගැටලුවේ සන්දර්භය තුළ මම මේ සඳහා උදාහරණයක් සපයමි: එම්එස්ඊ <0.001 සමඟ XOR සඳහා එන්එන් පුහුණු කිරීම සඳහා මගේ පුනරාවර්තන අවශ්ය නොවේද? .
සංඛ්යාව තෝරා සඟවා ස්ථර ජාලය අමු දත්ත වියුක්තකර ඉගෙන ඉඩ ලබා දෙයි. ගැඹුරු ඉගෙනීම මේ දිනවල ඇති වන කෝපය වන අතර ස්ථර විශාල සංඛ්යාවක් ඇති ජාලයන් ආකර්ෂණීය ප්රති .ල පෙන්නුම් කර ඇත. නමුත් සැඟවුණු ස්ථර වැඩිපුර එකතු කිරීමෙන් අවදානම් අධික ලෙස ගැලපීම හෝ ජාලය ප්රශස්ත කිරීම ඉතා අපහසු වේ.
දක්ෂ ජාල රැහැන් තෝරා ගැනීමෙන් ඔබට බොහෝ වැඩ කළ හැකිය. ඔබේ දත්ත ප්රභවය විශේෂිත ජාල සැකසුම් සඳහා සුදුසු ද? සංවහන ස්නායුක ජාලයන්ට “ව්යුහගත” දත්ත ප්රභවයන්, රූප හෝ ශ්රව්ය දත්ත මත ආකර්ෂණීය ප්රති results ල ලබා ගත හැකිය. පුනරාවර්තන ස්නායුක ජාලයන්ට ස්වාභාවික භාෂාව හෝ කාල ශ්රේණි දත්ත වැනි අනුක්රමික දත්ත වර්ග හොඳින් කළ හැකිය. අවශේෂ සම්බන්ධතා මගින් ගැඹුරු පෝෂක ජාල වැඩිදියුණු කළ හැකිය.
ස්නායුක ජාල පුහුණුව අගුලු දැමීම හා සමානයි
කලාවේ තත්වය හෝ හුදෙක් හොඳ ප්රති results ල ලබා ගැනීම සඳහා, හොඳින් වැඩ කිරීමට වින්යාස කර ඇති සියලුම කොටස් ඔබ විසින් සකස් කළ යුතුය. ඇත්ත වශයෙන්ම ඉගෙන ගන්නා ස්නායුක ජාල වින්යාසයක් සැකසීම අගුලක් තෝරා ගැනීම වැනි ය: සියලු කොටස් හරියටම පෙළ ගැසිය යුතුය . නිවැරදි ස්ථානයේ තනි ටම්බලර් එකක් තිබීම ප්රමාණවත් නොවනවා සේම, ගෘහ නිර්මාණ ශිල්පය පමණක් හෝ ප්රශස්තකරණය පමණක් නිවැරදිව සැකසීමට ප්රමාණවත් නොවේ.
වින්යාස තේරීම් සුසර කිරීම සැබවින්ම සරල නොවේ, එක් ආකාරයක වින්යාස තේරීමක් (උදා: ඉගෙනුම් අනුපාතය) තවත් එකකට වඩා වැඩි හෝ අඩු වැදගත්කමක් (උදා: ඒකක ගණන), මන්ද මෙම සියලු තේරීම් අනෙක් සියලුම තේරීම් සමඟ අන්තර්ක්රියා කරන බැවින් එකක් තේරීම වෙනත් තැනක කරන ලද වෙනත් තේරීමක් සමඟ හොඳින් කළ හැකිය .
මෙය වින්යාස කිරීමේ විකල්පයන් හෝ සංඛ්යාත්මක ප්රශස්තිකරණ විකල්පයන් නොවන වින්යාසගත විකල්පයන්ගේ පරිපූර්ණ නොවන ලැයිස්තුවකි.
මෙම මාතෘකා සියල්ලම පර්යේෂණයේ ක්රියාකාරී අංශ වේ.
උත්තල නොවන ප්රශස්තිකරණය දුෂ්කර ය
ස්නායුක ජාලයක වෛෂයික ක්රියාකාරිත්වය උත්තල වන්නේ සැඟවුණු ඒකක නොමැති විට පමණි, සියලු ක්රියාකාරීත්වයන් රේඛීය වන අතර සැලසුම් අනුකෘතිය පූර්ණ මට්ටමේ පවතී - මන්ද මෙම වින්යාසය සාමාන්ය ප්රතිගාමී ගැටළුවක් වන බැවිනි.
අනෙක් සියලුම අවස්ථාවන්හිදී, ප්රශස්තිකරණ ගැටළුව උත්තල නොවන අතර උත්තල නොවන ප්රශස්තිකරණය දුෂ්කර ය. ස්නායුක ජාල පුහුණු කිරීමේ අභියෝගයන් හොඳින් දනී (බලන්න: ගැඹුරු ස්නායුක ජාල පුහුණු කිරීම දුෂ්කර ඇයි? ). මීට අමතරව, ස්නායුක ජාලයන්හි ඉතා විශාල පරාමිති සංඛ්යාවක් ඇති අතර, එය අපට පළමු ඇණවුම් ක්රමවලට පමණක් සීමා වේ (බලන්න: නිව්ටන්ගේ ක්රමය යන්ත්ර ඉගෙනීමේදී බහුලව භාවිතා නොවන්නේ ඇයි? ). මෙය ඉතා ක්රියාකාරී පර්යේෂණ ක්ෂේත්රයකි.
ඉගෙනීමේ වේගය ඉතා විශාල ලෙස සැකසීම ප්රශස්තිකරණය අපසරනය වීමට හේතු වනු ඇත, මන්ද ඔබ “කැනියොන්” හි එක් පැත්තක සිට අනෙක් පැත්තට පනින බැවිනි. මෙය ඉතා කුඩා ලෙස සැකසීම මඟින් ඔබට සැබෑ ප්රගතියක් ලබා ගැනීමට නොහැකි වනු ඇති අතර, SGD හි ආවේනික ශබ්දය ඔබේ ශ්රේණියේ ඇස්තමේන්තු ඉක්මවා යාමට ඉඩ දෙනු ඇත. බලන්න:
ශ්රේණියේ ක්ලිපින් යම් සීමාවකට වඩා වැඩි නම් ශ්රේණියේ ප්රමිතිය නැවත පරිමාණය කරයි. සාමාන්යයෙන් 1.0 දී මෙය සෙට්-ඇන්ඩ්-අමතක කිරීමේ පරාමිතියක් යැයි මම සිතුවෙමි, නමුත් එල්එස්ටීඑම් භාෂා ආකෘතියක් 0.25 ලෙස සැකසීමෙන් නාටකාකාර ලෙස වඩා හොඳ කළ හැකි බව මට පෙනී ගියේය. ඒ ඇයිදැයි මම නොදනිමි.
ඉගෙනුම් අනුපාත උපලේඛනගත කිරීම පුහුණු කාලය තුළ ඉගෙනීමේ වේගය අඩු කළ හැකිය. මගේ අත්දැකීම් අනුව, උපලේඛනගත කිරීම උත්සාහ කිරීම රීජෙක්ස් වැනි ය : එය එක් ගැටළුවක් ("එක්තරා යුගයකට පසු ඉදිරියට යාමට ඉගෙන ගන්නේ කෙසේද?") ගැටළු දෙකක් සමඟ ප්රතිස්ථාපනය කරයි ("එක්තරා යුගයකින් පසුව ඉදිරියට යාමට මම ඉගෙන ගන්නේ කෙසේද? ? "සහ" මම හොඳ කාලසටහනක් තෝරා ගන්නේ කෙසේද? "). වෙනත් අය කියා සිටින්නේ උපලේඛනගත කිරීම අත්යවශ්ය බවයි. මම ඔයාට තීරණය කරන්න දෙන්නම්.
හොඳ මිනිබැච් ප්රමාණයක් තෝරා ගැනීම ඉගෙනීමේ ක්රියාවලියට වක්රව බලපෑම් කළ හැකිය, මන්ද විශාල කුඩා කණ්ඩායමකට කුඩා කුඩා කණ්ඩායමකට වඩා කුඩා විචල්යතාවයක් ( විශාල ප්රමාණයේ නීතියක් ) ඇති බැවිනි. ඔබට අවශ්ය වන්නේ කුඩා කණ්ඩායම ශ්රේණියේ දිශාව පිළිබඳ තොරතුරු දැන ගැනීමට තරම් විශාල විය යුතු නමුත් ඔබේ ජාලය විධිමත් කිරීමට SGD හට හැකි තරම් කුඩාය.
වැනිලා එස්ජීඩී මත වැඩිදියුණු කිරීම සඳහා ගම්යතාව, අනුවර්තන ඉගෙනුම් අනුපාත, නෙස්ටරොව් යාවත්කාලීන කිරීම් සහ යනාදිය භාවිතා කරන ස්ටෝචැස්ටික් ග්රේඩියන්ට් සම්භවය පිළිබඳ ප්රභේද ගණනාවක් තිබේ . වඩා හොඳ ප්රශස්තකරණය සැලසුම් කිරීම පර්යේෂණයේ ක්රියාකාරී අංශයකි. උදාහරණ කිහිපයක්:
එය මුලින්ම එළියට ආ විට, ඇඩම් ප්රශස්තකරණය විශාල උනන්දුවක් ජනනය කළේය. නමුත් මෑත කාලීන පර්යේෂණ කිහිපයකින් සොයාගෙන ඇත්තේ ගම්යතාවයෙන් යුත් එස්ජීඩී මගින් ස්නායුක ජාල සඳහා අනුවර්තන ශ්රේණියේ ක්රමවේදයන් ඉක්මවා යා හැකි බවයි. " යන්ත්රය ඉගෙනුම් දී අනුවර්තී Gradient ක්රම මෙම ආන්තික අනුරූපිතා අගය Ashia සී විල්සන්, රෙබෙකා Roelofs, මිචෙල් ස්ටර්න්, නේතන් Srebro බෙන්ජමින් Recht විසින්"
නමුත් අනෙක් අතට, මෙම නවතම ලිපිය මඟින් අනුවර්තන අනුපාත ක්රම සහ එස්ජීඩී අතර ඇති පරතරය ගම්යතාවයෙන් වසා දැමිය හැකි යැයි කියනු ලබන නව අනුවර්තන ඉගෙනුම් අනුපාත ප්රශස්තිකරණයක් යෝජනා කරයි. ක්වාන්ක්වාන් ගු හි ජිංහුයි චෙන් විසින් " ගැඹුරු ස්නායුක ජාල පුහුණු කිරීමේදී අනුවර්තී ශ්රේණියේ ක්රමවල සාමාන්යකරණ පරතරය වසා දැමීම "
ඉගෙනුම් අනුපාතය ස්වයංක්රීයව සකස් කිරීම සඳහා historical තිහාසික ශ්රේණියේ තොරතුරු භාවිතා කරන අනුවර්තී ශ්රේණියේ ක්රම, ගැඹුරු ස්නායුක ජාලයන් පුහුණු කිරීමේ වේගය සමඟ ස්ටෝචැස්ටික් ග්රේඩියන්ට් ඩෙසෙන්ට් (එස්ජීඩී) ට වඩා නරක ලෙස සාමාන්යකරණය කිරීම නිරීක්ෂණය කර ඇත. අනුවර්තී ශ්රේණියේ ක්රමවල සාමාන්යකරණ පරතරය වසා දැමිය හැකි ආකාරය මෙයින් විවෘත ගැටලුවක් වේ. මෙම කාර්යයේදී, ආදම්, ඇම්ස්ග්රෑඩ් වැනි අනුවර්තන ශ්රේණියේ ක්රම සමහර විට “අධික ලෙස අනුවර්තනය වී” ඇති බව අපි පෙන්වමු. අපි නව ඇල්ගොරිතමයක් නිර්මාණය කරමු, එය අර්ධ වශයෙන් අනුවර්තී ගම්යතා තක්සේරු කිරීමේ ක්රමය (පදම්), එය ආදම් / ඇම්ස්ග්රෑඩ් එස්ජීඩී සමඟ ඒකාබද්ධ කරමින් ලෝක දෙකෙන්ම හොඳම දේ ලබා ගනී. සම්මත මිණුම් සලකුණු පිළිබඳ අත්හදා බැලීම්වලින් පෙනී යන්නේ ගැඹුරු ස්නායුක ජාලයන් පුහුණු කිරීමේදී පදම්ට ඇඩම් / ඇම්ස්ග්රෑඩ් ලෙස වේගයෙන් අභිසාරී අනුපාතය පවත්වා ගත හැකි බවයි.
සාමාන්යකරණය
දත්තවල පරිමාණය පුහුණුව සම්බන්ධයෙන් විශාල වෙනසක් කළ හැකිය.
[ - 0.5 , 0.5 ]
කණ්ඩායම හෝ ස්ථර සාමාන්යකරණය කිරීමෙන් ජාල පුහුණුව වැඩි දියුණු කළ හැකිය. දෙදෙනාම උත්සාහ කරන්නේ ජාලය පුහුණු වන විට නියුරෝන සක්රීය කිරීම සඳහා ධාවනය වන මධ්යන්ය හා සම්මත අපගමනය තබා ගනිමින් ජාලය වැඩිදියුණු කිරීමට ය. මෙය පුහුණුවට උපකාරී වන්නේ ඇයිද යන්න හොඳින් වටහාගෙන නැති අතර පර්යේෂණයේ ක්රියාකාරී අංශයක් ලෙස පවතී.
- " අවබෝධතා කණ්ඩායම සාමාන්ය ජොහාන් Bjorck, කාර්ලා ගෝමස්, බාට් Selman විසින්"
- ජොනස් කෝලර්, හාඩි ඩැනේෂ්මන්ඩ්, ඕරලියන් ලුචි, මින්ග් ෂෝ, ක්ලවුස් නෙයිමේර්, තෝමස් හොෆ්මන් විසින් " කණ්ඩායම් සාමාන්යකරණය පිළිබඳ න්යායාත්මක අවබෝධයක් කරා "
- " කණ්ඩායම් සාමාන්යකරණය ප්රශස්තිකරණයට උපකාරී වන්නේ කෙසේද? (නැත, එය අභ්යන්තර කෝවරියට් මාරුව ගැන නොවේ) " ෂිබානි සන්තූර්කාර්, ඩිමිට්රිස් සිප්රාස්, ඇන්ඩ rew ඉලියාස්, ඇලෙක්සැන්ඩර් මැඩ්රි විසිනි
නියාමනය
ජාල නියාමනය තෝරා ගැනීම සහ සුසර කිරීම හොඳින් සාමාන්යකරණය කරන ආකෘතියක් ගොඩනැගීමේ ප්රධාන අංගයකි (එනම්, පුහුණු දත්ත වලට නොගැලපෙන ආකෘතියක්). කෙසේ වෙතත්, ඔබේ ජාලය පුහුණු දත්තවල අලාභය අඩු කිරීමට වෙහෙසෙන මොහොතේ - ජාලය ඉගෙන නොගන්නා විට - නියාමනය කිරීමෙන් ගැටලුව කුමක්ද යන්න අපැහැදිලි වේ.
මගේ ජාලය ඉගෙන නොගත් විට, මම සියලු නියාමනය අක්රිය කර නියාමනය නොකළ ජාලය නිවැරදිව ක්රියාත්මක වන බව තහවුරු කරමි. ඉන්පසු මම එක් එක් නියාමනය කිරීමේ කෑල්ලක් නැවත එකතු කර, ඒ සෑම එකක්ම ක්රියාත්මක වන බව තහවුරු කර ගනිමි.
මෙම උපක්රමය මඟින් යම් නියාමනය දුර්වල ලෙස සකසා ඇති තැන හඳුනාගත හැකිය. උදාහරණ කිහිපයක්
එල්2එල්1
නියාමනය කිරීමේ කොටස් දෙකක් ගැටුම්කාරී ය. නිදසුනක් ලෙස, ස්ථර සාමාන්යකරණය සහ හැලීම එකට භාවිතා කිරීම දුෂ්කර බව පුළුල් ලෙස නිරීක්ෂණය වී ඇත. එක්කෝ තනිවම ඉතා ප්රයෝජනවත් බැවින්, දෙකම භාවිතා කරන්නේ කෙසේද යන්න තේරුම් ගැනීම පර්යේෂණයේ ක්රියාකාරී ක්ෂේත්රයකි.
අත්හදා බැලීම් පොතක් තබා ගන්න
මම ස්නායුක ජාලයක් සැකසූ විට, මම කිසිදු පරාමිති සැකසුම් තදින් කේත නොකරමි. ඒ වෙනුවට, මම එය කරන්නේ වින්යාස ගොනුවක (උදා: JSON) කියවා ක්රියාත්මක වන විට ජාල වින්යාස තොරතුරු ජනනය කිරීමට භාවිතා කරයි. මම මේ සියලු වින්යාස ගොනු තබා ගන්නෙමි. මම කිසියම් පරාමිති වෙනස් කිරීමක් කළහොත්, මම නව වින්යාස ගොනුවක් සාදමි. අවසාන වශයෙන්, පුහුණුව සහ වලංගු කිරීම සඳහා එක් එක් යුගයට සිදුවන පාඩු සියල්ලම මම අදහස් ලෙස එකතු කරමි.
k
උදාහරණයක් ලෙස, මට LSTM භාෂා ආකෘති ගැන ඉගෙන ගැනීමට අවශ්ය විය, එබැවින් වෙනත් ට්විටර් භාවිතා කරන්නන්ට ප්රතිචාර වශයෙන් නව ට්වීට් ලියන ට්විටර් බොට් එකක් සෑදීමට මම තීරණය කළෙමි. මම මේ සඳහා මගේ නිදහස් කාලය තුළ, උපාධි පාසල සහ මගේ රැකියාව අතර වැඩ කළෙමි. එය වසරක් පමණ ගත වූ අතර, මට අවශ්ය දේ කළ ආකෘතියක් ලබා ගැනීමට පෙර මම විවිධ මාදිලි 150 කට අධික සංඛ්යාවක් පුනරාවර්තනය කළෙමි: (වර්ග කිරීම) අර්ථවත් වන නව ඉංග්රීසි භාෂා පෙළ ජනනය කරන්න. . එබැවින් එය ඉල්ලීම් වලට පිළිතුරු වශයෙන් ජර්මානු පෙළ වාචික කොටස් ප්රතිනිෂ්පාදනය කිරීමකි - ආකෘතිය වඩාත් ස්වයංසිද්ධව හා තවමත් අඩු අලාභයක් ඇති කිරීම සඳහා යම්කිසි වෙනස් කිරීමක් අවශ්ය විය.)