මම මැට්ලැබ් හි ස්නායුක ජාල මෙවලම් පෙට්ටිය භාවිතා කරන විට මෙය ව්යාකූල විය.
එය අමු දත්ත කොටස් තුනකට බෙදා ඇත:
- පුහුණු කට්ටලය
- වලංගු කිරීමේ කට්ටලය
- පරීක්ෂණ කට්ටලය
බොහෝ පුහුණු හෝ ඉගෙනුම් ඇල්ගොරිතම වල මම දකිමි, දත්ත බොහෝ විට කොටස් 2 කට බෙදා ඇත, පුහුණු කට්ටලය සහ පරීක්ෂණ කට්ටලය.
මගේ ප්රශ්න:
- වලංගු කිරීමේ කට්ටලය සහ පරීක්ෂණ කට්ටලය අතර වෙනස කුමක්ද?
- වලංගු කිරීමේ කට්ටලය ස්නායුක ජාලයට සැබවින්ම විශේෂිතද? නැතහොත් එය විකල්පයකි.
- තවදුරටත් ඉදිරියට යාමට, යන්ත්ර ඉගෙනීමේ සන්දර්භය තුළ වලංගු කිරීම සහ පරීක්ෂා කිරීම අතර වෙනසක් තිබේද?
The training set is used to fit the models; the validation set is used to estimate prediction error for model selection; the test set is used for assessment of the generalization error of the final chosen model. Ideally, the test set should be kept in a “vault,” and be brought out only at the end of the data analysis.