ভুল বাংলা ঠিক করবে ‘সঠিক’

বাংলা লেখার ভুল শোধরাতে এলো অনলাইন টুল ‘সঠিক’
ছবি: সংগৃহীত

অনলাইন যোগাযোগের দুনিয়ায় স্পষ্ট ও সঠিকভাবে লেখাটা খুব জরুরি, তা সে মেইল, ব্লগ পোস্ট বা সামাজিক যোগাযোগমাধ্যমের আপডেট– যাই হোক না কেন। লিখিত বার্তাটা হতে হবে সংক্ষিপ্ত, মিথস্ক্রিয়ামূলক এবং নির্ভুল। বাংলার মতো ভাষার ক্ষেত্রে এটি আরও বেশি প্রযোজ্য, যা কি না বিশ্বব্যাপী লাখো মানুষের মুখের ভাষা হওয়া সত্ত্বেও এর সাহায্যকারী ডিজিটাল টুলের সংখ্যা পর্যাপ্ত নয়।  

আর এই অপর্যাপ্ততা ঘোচাতেই আবির্ভাব হলো 'সঠিক'-এর। এটি বাংলাভাষী লেখকদের জন্য ক্লাউডভিত্তিক এমন একটি সহায়ক মাধ্যম, যা বর্তমান সময়ে বাংলা লেখার গল্পটাই পাল্টে দেবে। বৈশ্বিক পরিসরে জনপ্রিয় রাইটিং টুল গ্রামারলির মতো সঠিক বানান, ব্যাকরণ, যতিচিহ্ন, লেখার স্পষ্টতা ইত্যাদি বিষয় দেখে ভুল খুঁজে বের করে এবং শোধরানোর বিভিন্ন পরামর্শ দেবে।

বাংলা ভাষার ব্যাকরণে নিজস্ব যে সব নিয়ম-নীতি আছে, যা নিজস্ব ভাষাভাষী বক্তা ও পেশাদার লেখকদের জন্যেও অনেক ক্ষেত্রে বেশ কঠিন। ইংরেজি লেখকদের জন্য এত এত ডিজিটাল টুল থাকলেও বাজারে এর আগ পর্যন্ত বাংলার জন্য এমন কিছুই আসেনি। এই শূন্যস্থান পূরণ করতেই এসেছে সঠিক। এই সফটওয়্যারটি বাংলা লেখা স্ক্যানের পাশাপাশি সম্ভাব্য ত্রুটি শনাক্ত করতে মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে থাকে। তাই ঝামেলাটা বানান নিয়ে হোক বা ক্রিয়ার কাল, যতিচিহ্ন– সঠিক সব সময়ই সঠিক পরামর্শ দিয়ে লেখালেখির মান আরও উন্নত করতে সক্ষম।

সঠিক মূলত আইসিটি বিভাগের আওতাধীন বাংলাদেশ কম্পিউটারের 'এনহ্যান্সমেন্ট অব বাংলা ল্যাঙ্গুয়েজ ইন আইসিটি' বা 'আইসিটিতে বাংলা ভাষার সমৃদ্ধি' শীর্ষক প্রকল্পের একটি উপজাত। এই সরকারি প্রকল্পটি ২০১৭ সাল থেকে চালু রয়েছে। বিশেষত 'স্পেল চেকার' বা বানান সংশোধনকারী ফিচারটির উন্নয়নকাজ শুরু হয় ২০১৯ সালে। এই প্রকল্পের উদ্দেশ্য হচ্ছে বাংলা ভাষার সমৃদ্ধি ঘটিয়ে বিশ্বমাধ্যমে এর বিশেষ স্থান তৈরি করা। 

বাংলা ভাষায় লেখালেখি ও তা প্রকাশের সব রকম বাধাবিপত্তি দূর করাও এ প্রকল্পের আরেকটি লক্ষ্য। তাই সঠিক-এর পরিকল্পনা করা হয়ে একটি বাংলা কম্পিউটিং মডিউল হিসেবে। এবং এটি যাতে জনপরিসরে চাহিদা পূরণে সক্ষম হয়, সেটিও মাথায় রাখা হয়েছিল।

'সঠিক'-এর বিকাশ

এটি একটি তথ্যভিত্তিক অ্যাপ এবং মেশিং লার্নিং ব্যবস্থা। এর সাহায্যকারী হিসেবে রয়েছে কৃত্রিম বুদ্ধিমত্তা। অ্যাপ্লিকেশনটি ভালোভাবে তৈরির পর আরও উন্নয়নের কাজে বিশাল তথ্যভাণ্ডার ও মডেল ব্যবহৃত হয়।

মডেলটি প্রস্তুতের আগে নির্মাণকারী দল বাংলা একটি নির্দিষ্ট পরিমাণ টেক্সচুয়াল বা পাঠ্য ডেটাকে এনএলপি, অর্থাৎ ন্যাচারাল লার্নিং প্রবলেম হিসেবে চিহ্নিত করে। অবশ্য সেই তথ্যভাণ্ডারে এমন বহু সমস্যা ছিল, যার সমাধান করতে করতে সঠিক এ কাজে দক্ষ হয়ে ওঠে। 

মডেলিং প্রক্রিয়া ছাড়াও অ্যালগরিদম, সফটওয়্যার, ম্যানুয়াল ডেটা প্রসেসিং ছিল এই অ্যাপ্লিকেশনের মূল কাজ। এসব অত্যন্ত একঘেয়ে এবং সময়সাপেক্ষ কাজগুলো করেন এ বিষয়ে দায়িত্বপ্রাপ্ত কনসাল্টিং ফার্মের এক দল নিবেদিতপ্রাণ ভাষাবিদ। একটি গণমুখী মেশিন লার্নিং-ভিত্তিক অ্যাপ্লিকেশন পরিচালনার পথে বহু চ্যালেঞ্জ রয়েছে। সেসব চ্যালেঞ্জের সম্মুখীন হয়েও সফটওয়্যার দলটি এর অবকাঠামো তৈরির জন্য কঠোর পরিশ্রম করেছে। এ ছাড়া 'সঠিক'কে সুষ্ঠুভাবে চালিয়ে যাওয়ার জন্য তারা মূল প্রকল্পটিকেও আরও শক্তিশালী করে।

যেহেতু 'সঠিক' একটি সরকারি প্রকল্পের ফসল, এর পরিকল্পনা ও প্রাথমিক নকশা ইবিএলআইসিটি দ্বারা নির্ধারণ করে দেওয়া হয়। ইবিএলআইসিটি ১৬টি বিষয়ের অন্তর্ভুক্ত ৪০টিরও বেশি ডিজিটাল টুল ও রিসোর্স তৈরি করছে। সঠিকও সেগুলোর মধ্যে একটি।

সঠিক-এর সফটওয়্যার উন্নয়নের জন্য অংশীদার হচ্ছে 'রিভ'। বুয়েটের সিএসই বিভাগেও মনোনীত কনসাল্টেন্ট হিসেবে সফটওয়্যারের বিভিন্ন পরীক্ষা-নিরীক্ষায় কাজ করছে। এ ছাড়া প্রকল্পটির সব ধরনের কাজই একটি বিশেষজ্ঞ কমিটি দ্বারা যাচাই করা হয়। 

আরও কিছু দুর্দান্ত প্রকল্প

এই দলটি কৃত্রিম বুদ্ধিমত্তা-নির্ভর এনএলপি ও কম্পিউটার ভিশন সংক্রান্ত বেশ কিছু অ্যাপ্লিকেশন, যেমন– বাংলা ওসিআর এবং হাতের লেখা শনাক্তকরণ ব্যবস্থা গড়ে তুলছে। এটি মূলত বিভিন্ন রূপে, অর্থাৎ 'টেক্সট', 'স্পিচ টু টেক্সট' ও 'টেক্সট টু স্পিচ' অ্যাপ্লিকেশনে বাংলা ভাষার বিভিন্ন বার্তার আবেগীয় মূল্যায়ন, শ্রবণ ও বাক প্রতিবন্ধীদের জন্য বাংলা সাংকেতিক ভাষা শনাক্তকারী ব্যবস্থা, দৃষ্টি প্রতিবন্ধীদের জন্য স্ক্রিন রিডার এবং ব্রেইল পদ্ধতি তৈরি এবং বাংলাদেশের মোট ৪০টি ভাষাকে ডিজিটাইজ করার জন্য বাংলা ন্যাশনাল কর্পাস ডেভেলপমেন্টের একটি প্রকল্প, যার মধ্যে ১৪টি বিলুপ্তপ্রায় আদিবাসী ভাষা রয়েছে।

এ ছাড়া দলটি সবগুলো ভাষা ও লেআউটের জন্য একটি বৈশ্বিক কি-বোর্ডও ডেভেলপ করেছে। বর্তমানে গবেষক ও প্রকৌশলীদের জন্য সহায়ক টুল হিসেবে বাংলা ট্রিব্যাংক ও বিভিন্ন ল্যাঙ্গুয়েজ মডেল ডেভেলপমেন্ট, লেবেলিং, মাঠ পর্যায়ে তথ্য সংগ্রহের ব্যবস্থা ও ট্যাগিং প্ল্যাটফর্ম তৈরি করছে। একটি সংক্ষিপ্ত ই-মেইল সাক্ষাৎকারে দলটি জানায়, শিগগিরই এমন কিছু শক্তিশালী প্রকল্প শুরু হবে, যার মধ্যে রয়েছে মেশিন ট্রান্সলেটর এবং বাংলা ভার্চুয়াল প্রাইভেট অ্যাসিস্টেন্ট। এই প্রকল্পগুলোর অধিকাংশই ইতোমধ্যে ডেভেলপ করা হয়ে গেছে এবং বেটা-রিলিজের জন্য অপেক্ষায় রয়েছে। আশা করা যায়, এসব টুল সম্পূর্ণ প্রস্তুত হয়ে গেলে তথ্য-প্রযুক্তির জগতে বাংলা ভাষা আরও ছড়িয়ে পড়বে।

তারা আরও জানান, বিশ্বের যেকোনো প্রান্তের বাংলাভাষীদের জন্যই সঠিক পুরোপুরি বিনামূল্যে ব্যবহার করা যাবে। দলটি আশাবাদী যে, মুদ্রণ, প্রকাশ ও শিক্ষাক্ষেত্রে সরকারি প্রতিষ্ঠানগুলো সঠিক ব্যবহারের মাধ্যমে উপকৃত হবে। এ বিষয়ে তাদের চূড়ান্ত লক্ষ্য হচ্ছে জনপরিসরে বিনামূল্যে ব্যবহারের জন্য একটি উঁচু মানের বানান ও ব্যাকরণ সংশোধনকারী সফটওয়্যার ডেভেলপ করা। 

 

অনুবাদ করেছেন অনিন্দিতা চৌধুরী
 

Comments

The Daily Star  | English
gold price rises in Bangladesh

Gold shines through 2025 amid price volatility

If there were a “metal of the year” award, gold would be a strong contender, maintaining an exceptional run even on the final trading day of 2025..Businesspeople said the retail gold market in Bangladesh has remained unstable over the past few months, driven by fluctuating global prices, s

Now