রজনীকান্তের “রোবট” সিনেমাটার কথা মনে আছে? যেখানে চিট্টি নামের এক রোবট ছিল যাকে বলা হয়েছিল টিভি খুলার জন্য আর সে মাটিতে টিভিটা ছুঁড়ে ফেলে দিয়ে বলেছিল, “আমাকে তো খুলতে বলা হয়েছে টিভি অন করতে তো বলা হয় নাই”।
আমরা কম্পিউটার বা মেশিন যাই বলি না কেন এদের নিজেদের কোন বোধশক্তি নেই। এদের যা নির্দেশনা দেয়া হয় এরা সেই নির্দেশনা (command) মত কাজ করে শুধু। আমরা মানুষরা সাধারণত যে ভাষায় কথা বলি তা এরা বুঝতে পারে না। কম্পিউটারকে মানুষের ভাষা ঠিকমত বোঝানোর জন্য বিজ্ঞানীরা গবেষণা করে চলেছেন। কৃত্রিম বুদ্ধিমত্তার অন্তর্গত এই শাখাটির নাম হলো ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং, সংক্ষেপে এনএলপি।

ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং কী
ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) হচ্ছে কৃত্রিম বুদ্ধিমত্তা (Artificial Intelligence)-এর একটি শাখা যা মানুষের ভাষার বিশ্লেষণ করে সেটা বুঝে মানুষ এবং কম্পিউটারের সাথে মিথস্ক্রিয়া (Interaction) করে। এর অন্যতম চ্যালেঞ্জ হচ্ছে কম্পিউটারকে শেখানো যে কিভাবে মানুষ শিখে এবং ভাষার ব্যবহার করে। বিষয়টা কিন্তু অভিধান ব্যবহার করার মত সহজ-সরল কাজ নয়। অনেকসময় দেখা যায় একটি শব্দ ভিন্ন ভিন্ন বাক্যে ভিন্ন ভিন্ন অর্থ বহন করে।
যেমনঃ
অরুনা ‘ভাল’ রান্না করে (বিশেষণ)।
আপন ‘ভাল’ সবাই চায় (বিশেষ্য)।
এই দুটি বাক্যতে ভাল শব্দটা আছে কিন্তু বাক্য দুটিতে শব্দটির পদ (Parts of speech) ভিন্ন।
এখন কথা হচ্ছে আমরা তো জানি এবং বুঝি বিশেষ্য কী জিনিস, বিশেষণ কী জিনিস। কিন্তু কম্পিউটার তো বুঝে না। তাই কম্পিউটারকে মানুষের ভাষা বোঝানোর জন্য ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং-এর উদ্ভব।
ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর টুলস
স্টানফোর্ড ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং গ্রুপ (The Stanford Natural Language Processing Group) ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর জন্য অনেক সফট্ওয়্যার তৈরি করেছে যেগুলো সবার জন্য সহজলভ্য। এর একটি উল্লেখযোগ্য সফট্ওয়্যারের নাম কোর এনএলপি (Stanford CoreNLP). এর মধ্যে ইংরেজি, স্প্যানিশ এবং চাইনিজ ভাষার প্রসেসিং এর টুলস্ (tools) রয়েছে। স্টানফোর্ড এনএলপি (Stanford NLP) সম্পর্কে বিস্তারিত জানা যাবে এই লিঙ্কে।
এনএলপি কেন প্রয়োজন
অনেকের মনে এই পর্যায়ে মনে হতে পারে, কম্পিউটারকে মানুষের ভাষা বোঝানোর দরকার কী? সে থাকুক না প্রোগ্রামিং করা আর গেমস খেলা নিয়ে। কিন্তু, এমন যদি হতো যে কম্পিউটারকে কোডের ইন্সট্রাকশন বলা মাত্র সে ঘটঘট করে কোডটা নিজেই লিখে ফেলতো! মজার ব্যাপার হচ্ছে স্পীচ রিকগনিশন (speech recognition) টেকনিকের এর মাধ্যমে কম্পিউটার এই কাজটা কিছুটা করতে পারে। IBM VoiceType হচ্ছে প্রায় এমনই একটা সিস্টেম। যেটা মানুষের বলা শব্দগুলোকে বিশ্লেষণ করে সাথে সাথে কম্পিউটারের স্ক্রিনে দেখায়।
আমাদের কাছে বর্তমানে Google Translate একটা জনপ্রিয় নাম। এটাও ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর একটা খুবই সুন্দর অ্যাপ্লিকেশন। খুব দ্রুত কোন শব্দের যে কোন ভাষার অনুবাদ এটি খুব সহজে করে দেয়।
তথ্য খোঁজার চিরুনি অভিযান
ইনফরমেশন রিট্রাইভাল (Information Retrieval) নামক ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর আরেকটি টেকনিক আছে, যার মাধ্যমে বিশাল একটা তথ্য ভান্ডার থেকে শুধুমাত্র প্রয়োজনীয় তথ্য বের করে আনা হয়। এই ধরনের সিস্টেমের কাজ শুরু করে যখন ইউজার সিস্টেমে একটা কুয়েরি (query) দেয়। সেই কুয়েরি (query)-এর উপর ভিত্তি করে সিস্টেম শুধুমাত্র প্রাসঙ্গিক তথ্যসমূহ প্রদান করে থাকে। যেমনঃ বিভিন্ন সার্চ ইঞ্জিন।
বাংলা ভাষা এবং ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং
বর্তমানে ইংরেজিতে ন্যাচারাল লাঙ্গুয়েজ প্রসেসিং এর কাজ অনেক এগিয়ে গেলেও বাংলা ভাষায় এর কাজ ইংরেজির তুলনায় অনেক কম। বাংলা ভাষার জন্য গবেষণার কাজটি তো বিদেশীরা এসে করে দিবে না, বাংলাদেশের মানুষকেই সেটা করতে হবে। ব্র্যাক বিশ্ববিদ্যালয়ে বাংলা ভাষার গবেষণার জন্য গবেষণাগার আছে। যেখানে বাংলা ভাষার প্রসেসিং নিয়ে বিভিন্ন গবেষণা করা হয়। বাংলাদেশের সার্চ ইঞ্জিন “পিপীলিকা” বাংলা ভাষার প্রথম ও এখন পর্যন্ত একমাত্র সার্চ ইঞ্জিন। পিপীলিকা তৈরি করার সময় ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং নিয়ে বেশ কিছু কাজ করতে হয়েছে। সিলেটের শাহজালাল বিজ্ঞান ও প্রযুক্তি বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞান ও প্রকৌশল বিভাগ গ্রামীণফোন আইটি লিমিটেডের সহায়তায় তৈরি করেছে এই বাংলা সার্চ ইঞ্জিন। এটির উন্নয়ন কার্যক্রম এখনও চলছে।
ভবিষ্যৎ গবেষণার ক্ষেত্র
যদিও ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর অনেক অ্যাপ্লিকেশন বর্তমানে আছে, কিন্তু সেসব অ্যাপ্লিকেশনের এর ফলাফল খুব একটা সন্তোষজনক নয়। মানুষ সাধারণত যে ভাষায় কথা বলে সেসব কথা কোন NLP যন্ত্রের পক্ষে বিশ্লেষণ করে সঠিক অর্থ প্রকাশ করা যথেষ্ট কঠিন। এছাড়া বিভিন্ন দেশের মানুষের ভাষা ভিন্ন, কথা বলার স্টাইল ভিন্ন। তবে মানুষের অসাধ্য কিছুই নেই। হয়ত ভবিষ্যতে আমরা শতভাগ সঠিক কোন ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং সিস্টেম দেখতে পারবো। যা হবে কৃত্রিম বুদ্ধিমত্তার সাফল্যের একটি মাইলফলক।
লেখকঃ তামান্না নিশাত রিনি।