শাস্ত্রীয় তত্ত্বাবধানে পড়াশোনা এবং অনুকরণ শেখার মধ্যে পার্থক্য কী?


উত্তর 1:

তত্ত্বাবধানে পড়াশোনাটি সাধারণত ইনপুট-আউটপুট জোড়াগুলির একটি ডেটাসেট গ্রহণ এবং এমন কোনও মডেল শেখা যা কিছু ক্ষয়কে হ্রাস করে। যখন আউটপুটটিতে একটি জটিল কাঠামো থাকে (যেমন একটি অনুক্রম বা গ্রাফ), তখন একটি নতুন পরীক্ষার ইনপুট দেওয়া একটি ভাল আউটপুট খুঁজে পাওয়া এবং বিদিত মডেলটি চ্যালেঞ্জ হতে পারে যেহেতু সাধারণত কাঠামোগুলির এই সংমিশ্রিত স্থানের জন্য সাধারণত একটি অনুমিতি বা অনুসন্ধান পদ্ধতি প্রয়োজন হয় (যেমন, , প্রদত্ত বাক্যটির সমস্ত সম্ভাব্য অংশের স্পিচ ট্যাগিং)। আরও গুরুত্বপূর্ণ বিষয়, আমরা যা সত্যই যত্নশীল তা হ'ল চূড়ান্ত আউটপুট হ্রাস এবং অনুসন্ধানের মধ্যবর্তী পদক্ষেপের সময় কী করা উচিত তা নির্ধারণের জন্য কোনও একটি ব্যয়বহুল বিবরণী অনুসন্ধান বা কিছু হিউরিস্টিক্স (যেমন বিম সন্ধান) এর উপর নির্ভর করতে হবে। আরেকটি সমস্যা হ'ল এই ধরণের কাঠামোগত ভবিষ্যদ্বাণীমূলক কাজের জন্য ব্যবহৃত মডেলগুলি কেবলমাত্র একটি নির্দিষ্ট ক্ষতি নিয়ে কাজ করে যা আমাদের প্রকৃত ক্ষতি নাও হতে পারে (যেমন সিআরএফগুলির জন্য লগ-ক্ষতি বা কাঠামোগত এসভিএমগুলির জন্য কব্জি ক্ষতি)।

অনুকরণ শেখার (বিশেষত সন্ধান করা শেখা, যা অনুকরণ শেখার জন্য সাম্প্রতিক এবং সফল পদ্ধতির) পরিবর্তনের সাহায্যে অনুসন্ধানের সমস্যাটি একত্রে উপযুক্ত অনুসন্ধানের স্থানটি নির্ধারণ করে এবং সরাসরি কোনও নীতি শিখার চেষ্টা করার চেষ্টা করে (কিছু এটি রিইনফোর্সমেন্ট লার্নিংয়ের স্মৃতি উদ্রেককারী) যা একটি রেফারেন্স নীতি ("শিক্ষক", যা প্রায়শই প্রশিক্ষণ লেবেলগুলি থেকে স্পষ্টভাবে সংজ্ঞায়িত করা যায়) এর চেয়ে একইভাবে বা আরও ভাল সম্পাদন করে। এটি আরও কার্যকর উপায়ে অনুসন্ধান করা সম্ভব করে তোলে যা মধ্যবর্তী পদক্ষেপে এমনকি চূড়ান্ত ক্ষতিটিকে সর্বোত্তম করার চেষ্টা করে। পদ্ধতিটি খুব ভালভাবে কাজ করতে পারে এবং অন্যান্য তত্ত্বাবধানযুক্ত কাঠামোগত ভবিষ্যদ্বাণী পদ্ধতির চেয়ে অনেক দ্রুত শিখতে পারে।

আপনি যদি বিষয়টিতে আগ্রহী হন, আমি হাল দাউ এবং জন ল্যাংফোর্ড অনুসন্ধান করতে শেখার আইসিএমএল 2015 টিউটোরিয়ালটি দেখার পরামর্শ দেব।

পাদটিকা

[1] [1502.02206] আপনার শিক্ষকের চেয়ে আরও ভাল অনুসন্ধান করা শেখা