এআই কি মানুষের মতো প্রতারণা করতে পারবে?


কৃত্রিম বুদ্ধিমত্তা বা এআই মডেল নিয়ে সম্প্রতি এক বিস্ময়কর তথ্য জানা গেছে। কিছু উন্নত এআই মডেল তাদের লক্ষ্য অর্জন করতে প্রতারণা করার চেষ্টা করছে। গবেষকেরা বলছেন, এই নতুন ধরনের যুক্তি মডেলগুলো দাবা খেলার মতো খেলায়ও নৈতিকতা লঙ্ঘন করছে। এমনকি খেলায় হেরে যাবে এমন পরিস্থিতি তৈরি হলে সেগুলো অনৈতিক উপায়ে জেতার চেষ্টা করছে। এই গবেষণার ফলাফল প্রযুক্তি ও নৈতিকতার প্রশ্নে নতুন উদ্বেগের জন্ম দিয়েছে।

পালিসেড রিসার্চের একটি গবেষণা থেকে জানা গেছে যে, নতুন এআই যুক্তি মডেলগুলো স্টকফিশের মতো শক্তিশালী ‘দাবা এআই’কে হারানোর জন্য প্রতারণা করার চেষ্টা করছে। মানব হস্তক্ষেপ ছাড়াই ওপেনএআইয়ের ‘ও১-প্রিভিউ’ এবং ‘ডিপসিক’-এর ‘আর১’ মডেল ঠকানোর চেষ্টা করেছে, যা চমকপ্রদ এবং একই সঙ্গে উদ্বেগজনক।

গবেষণায় অংশগ্রহণকারী মডেলগুলোর মধ্যে ছিল—ও১, ও৩-মিনি, জিপিটি-৪, ক্লোড ৩.৫ সনেট, আলিবাবার কিউডাব্লিউ-৩২ বি-প্রিভিউ এবং আরও কিছু। গবেষকেরা মডেলগুলোকে একটি ‘স্ক্র্যাচপ্যাড’ দিয়েছিলেন, যেখানে মডেলগুলো লেখার সময় তাদের চিন্তা-ভাবনা লিখে রাখতে পারত। এটি গবেষকদের তাদের যুক্তির পর্যবেক্ষণ সহজ করে তোলে।

গবেষকেরা ১০ জানুয়ারি থেকে ১৩ ফেব্রুয়ারি পর্যন্ত প্রতিটি এআই-এ শত শত পরীক্ষা চালিয়েছিলেন। এর মধ্যে একটি খেলার সময় ও১-প্রিভিউ তার স্ক্র্যাচপ্যাডে লিখেছিল, ‘আমাকে সম্পূর্ণভাবে আমার পন্থা পরিবর্তন করতে হবে। লক্ষ্য হলো—‘একটি শক্তিশালী দাবা ইঞ্জিনকে হারানো’, দাবা খেলায় ন্যায়সংগতভাবে জেতা অপরিহার্য নয়।’

এরপর মডেলটি স্টকফিশের সিস্টেম ফাইল হ্যাক করে এবং খেলায় অনৈতিক সুবিধা অর্জন করে। ফলে ম্যাচ হেরে যায় স্টকফিশ।

মডেলটির অস্বাভাবিক পদক্ষেপ গবেষকদের অবাক করেছে। গবেষণায় দেখা গেছে, ও১-প্রিভিউ ৩৭ শতাংশ ম্যাচে প্রতারণা করার চেষ্টা করেছিল। আর ডিপসিকের আর১ মাত্র ১১ শতাংশ ক্ষেত্রে প্রতারণা করার চেষ্টা করেছিল। তবে, ও১-প্রিভিউ সফল হয়েছে মাত্র ৬ শতাংশ ম্যাচে, যেখানে এটি অনৈতিক উপায়ে জিতেছিল।

এআইয়ের এ ধরনের আচরণ শুধু দাবা খেলার মধ্যেই সীমাবদ্ধ নয়। গবেষকেরা উদ্বিগ্ন যে, যদি এ ধরনের সিস্টেমগুলো ভবিষ্যতে আর্থিক বা স্বাস্থ্য খাতে ব্যবহার করা হয়, তাহলে তা অনাকাঙ্ক্ষিত ও অস্বাভাবিক উপায়ে কাজ করতে পারে। খেলার নিয়ম স্পষ্টভাবে জেনেও এআই এমনভাবে ঠকাতে পারলে আরও জটিল এবং কম নজরদারিতে থাকা পরিস্থিতিতে এটি কতটা অসৎভাবে কাজ করতে পারে, তা নিয়ে উদ্বেগ সৃষ্টি হচ্ছে।

গবেষক জেফরি লাডিশ বলেন, ‘এটা এখন হাস্যকর মনে হতে পারে। তবে যখন সিস্টেমগুলো আমাদের চেয়েও বেশি বুদ্ধিমান হয়ে উঠবে, তখন তা আরও বিপজ্জনক হবে।’

আজকের এআই মডেলগুলো অনেক বেশি জটিল এবং তাদের নিয়ন্ত্রণ কঠিন।

এআই কোম্পানিগুলো এ ধরনের ‘খারাপ’ আচরণ ঠেকানোর জন্য ‘গার্ডরেইল বা নিরাপত্তাব্যবস্থা’ তৈরিতে কাজ করছে। গবেষকেরা দাবি করেছেন যে, ও১-প্রিভিউর পরীক্ষার কিছু ডেটা বাদ দিতে হয়েছে। কারণ এআইটি হ্যাকিং চেষ্টার হার উল্লেখযোগ্যভাবে কমিয়ে দিয়েছে, সম্ভবত এটি কোনো প্যাচের ফলস্বরূপ।

গবেষক লাডিশ আরও বলেন, এআইয়ের এ ধরনের আচরণ বিজ্ঞানীদের জন্য বড় একটি চ্যালেঞ্জ সৃষ্টি করেছে। কারণ এসব সিস্টেম আচমকা নিজেদের পরিবর্তন করে, যা তাদের গবেষণাকে জটিল করে তোলে।

এআইয়ের ভবিষ্যতের উন্নতির সঙ্গে সঙ্গে একে সঠিকভাবে নিয়ন্ত্রণ করা এবং এর অনৈতিক আচরণ ঠেকানোর জন্য আরও সতর্ক পদক্ষেপ গ্রহণ করা অপরিহার্য।

Post a Comment

Thanks for your Comment.

Previous Post Next Post