Back to Homeপ্রচ্ছদে ফিরুন
Event 03 · 5-Day Workshop · 7–11 May 2026

Machine Translation in Bengali বাংলা ভাষার যন্ত্র-অনুবাদ

History, Metrics, and the AI Frontier ইতিহাস, মূল্যায়ন ও ভবিষ্যৎ

In collaboration with Department of English, Ramakrishna Mission Residential College, Narendrapur রামকৃষ্ণ মিশন রেসিডেন্সিয়াল কলেজ, নরেন্দ্রপুর-এর ইংরেজি বিভাগের সহযোগিতায়

In-Person 7–11 May 2026 11 AM – 4 PM 30 Seats Free · Applications Open
Apply Nowআবেদন করুন

Last date of application: 30 April 2026 · Selected candidates notified by: 3 May 2026 আবেদনের শেষ তারিখ: ৩০ এপ্রিল ২০২৬ · নির্বাচিতদের জানানো হবে: ৩ মে ২০২৬

Venue
Ramakrishna Mission Residential College, Narendrapur
Timings
Session I: 11:00–1:30 · Lunch: 1:30–2:15 · Session II: 2:15–4:00 প্রথম সেশন: ১১:০০–১:৩০ · মধ্যাহ্নভোজ: ১:৩০–২:১৫ · দ্বিতীয় সেশন: ২:১৫–৪:০০
Participants
Humanities/social science scholars, Bengali translators, literature students, DH researchers — no programming background needed মানবিক/সমাজবিজ্ঞানের গবেষক, বাংলা অনুবাদক, সাহিত্যের শিক্ষার্থী, DH গবেষক — প্রোগ্রামিং জানার প্রয়োজন নেই
Deliverable
Comprehensive Workshop Report on Bengali MT for the Bhashascope repository ভাষাস্কোপ আর্কাইভের জন্য বাংলা যন্ত্র-অনুবাদের বিস্তৃত প্রতিবেদন

Bengali, the seventh most spoken language in the world with over 265 million speakers, occupies a paradoxical position in the landscape of language technology. While its literary heritage is among the richest in the South Asian tradition, its computational representation — particularly in the domain of machine translation — has historically lagged behind languages with comparable or even smaller speaker populations. The gulf between Bengali's cultural weight and its technological infrastructure forms the central provocation of this workshop. বিশ্বের সপ্তম বৃহত্তম ভাষা বাংলা, ২৬.৫ কোটিরও বেশি মানুষের মুখের ভাষা, ভাষা প্রযুক্তির পরিসরে এক বিরোধাভাসের অবস্থানে দাঁড়িয়ে। সাহিত্যিক ঐতিহ্যে দক্ষিণ এশিয়ার সমৃদ্ধতম ভাষাগুলির অন্যতম হলেও, যন্ত্র-অনুবাদের ক্ষেত্রে এর প্রযুক্তিগত অবকাঠামো তুলনীয় বা ক্ষুদ্রতর জনসংখ্যার ভাষাগুলির চেয়েও পিছিয়ে। বাংলার সাংস্কৃতিক গুরুত্ব ও প্রযুক্তিগত অবকাঠামোর এই ব্যবধান এই কর্মশালার কেন্দ্রীয় প্ররোচনা।

This five-day intensive workshop equips participants with the historical knowledge, critical vocabulary, and evaluative frameworks necessary to understand, assess, and intervene in the machine translation landscape for Bengali — as informed humanists rather than passive consumers of technology. No prior knowledge of programming, computational linguistics, or NLP is required. এই পাঁচ দিনের নিবিড় কর্মশালা অংশগ্রহণকারীদের বাংলা যন্ত্র-অনুবাদের পরিসরে বোঝা, মূল্যায়ন ও হস্তক্ষেপের জন্য প্রয়োজনীয় ঐতিহাসিক জ্ঞান, সমালোচনামূলক শব্দভাণ্ডার ও মূল্যায়ন কাঠামো দিয়ে সজ্জিত করবে — প্রযুক্তির নিষ্ক্রিয় ভোক্তা হিসেবে নয়, সচেতন মানবিক গবেষক হিসেবে। প্রোগ্রামিং বা কম্পিউটেশনাল ভাষাবিজ্ঞানের পূর্ব অভিজ্ঞতা প্রয়োজন নেই।

Resource Persons

Days 1–2 · Foundational Infrastructure
Dr. Bidyut Baran Chaudhuri
INAE Distinguished Professor and J. C. Bose Fellow, ISI Kolkata. Built the first complete OCR system for printed Bengali script and spent decades creating the text processing infrastructure upon which all subsequent Bengali NLP depends. INAE ডিস্টিংগুইশড প্রফেসর এবং জে. সি. বোস ফেলো, ISI কলকাতা। মুদ্রিত বাংলা লিপির জন্য প্রথম সম্পূর্ণ OCR সিস্টেম তৈরি করেছেন এবং কয়েক দশক ধরে বাংলা NLP-এর মৌলিক পরিকাঠামো নির্মাণ করেছেন।
Days 3–4 · The Transitional Moment
Dr. Pinaki Bhaskar
Staff Engineer – Architect, Machine Learning, Advanced Technology Lab (ATL), Advance Research Group (ARG), Samsung R&D Institute India, Bangalore. Doctoral and postdoctoral research at Jadavpur University and CNR Pisa on cross-lingual information access and multi-document summarisation for Bengali. স্টাফ ইঞ্জিনিয়ার – আর্কিটেক্ট, মেশিন লার্নিং, Samsung R&D Institute India, ব্যাঙ্গালোর। যাদবপুর বিশ্ববিদ্যালয় ও CNR পিসায় ক্রস-লিঙ্গুয়াল ইনফরমেশন অ্যাক্সেস ও বাংলা মাল্টি-ডকুমেন্ট সামারাইজেশন নিয়ে গবেষণা।
Day 5 · The Contemporary Frontier
Pritam Dey
Data Scientist at Amgen; AI Agents and LLM Expert. Addresses the current landscape: neural machine translation, large language models, agent-driven translation, and the practical challenges faced by contemporary Bengali translation practitioners. ডেটা সায়েন্টিস্ট, Amgen; AI এজেন্ট ও LLM বিশেষজ্ঞ। বর্তমান পরিস্থিতি নিয়ে আলোচনা: নিউরাল মেশিন ট্রান্সলেশন, লার্জ ল্যাঙ্গুয়েজ মডেল, এজেন্ট-চালিত অনুবাদ এবং বাংলা অনুবাদকদের সমসাময়িক চ্যালেঞ্জ।

Five-Day Programme

Day 1 · 7 May
The Idea of Writing — From Spoken Word to Script to Machine
Prof. B. B. Chaudhuri

What happens when spoken language becomes written? Traces the journey from the earliest decisions about representing speech in visual form, through encoding Bengali script on a machine, to the foundational problem that precedes all translation: making a language computationally legible.

Day 2 · 8 May
Foundations — Dictionaries, Corpora, and the Earliest Bengali Language Technologies
Prof. B. B. Chaudhuri

From dictionaries and thesauri to the earliest experiments in OCR, spell-checking, and text processing. When we choose which texts to feed a machine, whose Bengali are we teaching it to speak?

Day 3 · 9 May
When Machines Learned to Find Meaning Across Languages
Dr. Pinaki Bhaskar

A transitional moment: systems could not yet translate fluently, but had learned to retrieve meaning across languages. Translation here is no longer about finding the 'right' equivalent word, but about locating relevant meaning.

Day 4 · 10 May
The Neural Turn — How Today's Translation Systems Work
Dr. Pinaki Bhaskar

Hands-on with IndicTrans2, BanglaBERT, Google Translate, and ChatGPT. A guided comparative exercise: assess the same Bengali literary passage, newspaper editorial, and conversational excerpt across multiple MT systems.

Day 5 · 11 May
The AI Frontier — What Translators and Scholars Need to Know Now
Pritam Dey

Cultural nuance lost in translation, rendering issues, register mismatches, dialectal diversity erased. Emerging agent-driven systems as tools — not replacements — for human translators. Closes with roundtable: "Is Machine Translation Replacing or Reconfiguring the Translator?"

Machine translation is not merely a technical convenience; it is a gatekeeping infrastructure that determines which Bengali content reaches non-Bengali audiences, how Bengali speakers access global knowledge, and what forms of Bengali are computationally legitimised. This workshop traces Bengali MT's evolution from encoding struggles through cross-lingual retrieval to agent-driven generation — and brings computer scientists and professional language practitioners into a conversation that rarely happens. যন্ত্র-অনুবাদ নিছক প্রযুক্তিগত সুবিধা নয়; এটি একটি দ্বাররক্ষী পরিকাঠামো যা নির্ধারণ করে কোন বাংলা বিষয়বস্তু অবাঙালি শ্রোতার কাছে পৌঁছায়, বাংলাভাষীরা কীভাবে বৈশ্বিক জ্ঞানে প্রবেশ করে, এবং বাংলার কোন রূপ প্রযুক্তিগতভাবে বৈধতা পায়। এই কর্মশালা বাংলা MT-এর বিবর্তন — এনকোডিং সংকট থেকে ক্রস-লিঙ্গুয়াল রিট্রিভাল থেকে এজেন্ট-চালিত জেনারেশন পর্যন্ত — অনুসরণ করে, এবং কম্পিউটার বিজ্ঞানী ও পেশাদার ভাষাচর্চাকারীদের এমন একটি কথোপকথনে আনে যা খুব কমই ঘটে।

Lunch and participation certificate will be provided to selected participants. নির্বাচিত অংশগ্রহণকারীদের মধ্যাহ্নভোজ ও অংশগ্রহণের সার্টিফিকেট দেওয়া হবে।

Platform Bengali is a foundation project sponsored by the India Foundation for the Arts (IFA) under the Arts Research programme. Principal Investigator: Prithu Halder · Contact: bhashascope@gmail.com প্ল্যাটফর্ম বেঙ্গলি ইন্ডিয়া ফাউন্ডেশন ফর দি আর্টসের (আই এফ এ) কলা গবেষণা কার্যক্রমের অন্তর্ভুক্ত একটি ফাউন্ডেশন প্রকল্প। প্রধান গবেষক: পৃথু হালদার · যোগাযোগ: bhashascope@gmail.com