দেখছেন: বাংলা ইংরেজিতে দেখুন

ছবি থেকে টেক্সট — আপনার ব্রাউজারে OCR

ফটো, স্ক্রিনশট এবং স্ক্যান করা ডকুমেন্ট থেকে টেক্সট বের করুন। Tesseract OCR পুরোপুরি আপনার ব্রাউজারে চলে — কিছুই আপলোড হয় না।

ছবি এখানে ছাড়ুন বা
  1. এক বা একাধিক ছবির জন্য ছাড়ুন বা ব্রাউজ করুন — JPG, PNG, WebP, বা BMP।
  2. যদি আপনার টেক্সট ইংরেজি না হয় একটি ভাষা বাছুন — সেই ভাষায় প্রথম চালনা মডেল (3–14 MB) ডাউনলোড করে এবং পরের বারের জন্য আপনার ব্রাউজারে এটি ক্যাশ করে।
  3. সব বের করুন ক্লিক করুন। প্রথম চালনা এই সাইট থেকে প্রায় 8 MB OCR ইঞ্জিন এবং ভাষা ডেটা ডাউনলোড করে (আপনার ব্রাউজার দ্বারা ক্যাশ করা এবং ব্যাচের প্রতিটি ছবিতে পুনরায় ব্যবহার করা)।
  4. প্রথম ছবির স্বীকৃত টেক্সট নিচের প্রিভিউতে প্রদর্শিত হয়। প্রতিটি ছবির টেক্সট তার সারি থেকে পৃথকভাবে ডাউনলোড করুন, ক্লিপবোর্ডে সবকিছু কপি করুন, বা শিরোনাম দ্বারা বিভক্ত প্রতিটি ফাইলের আউটপুট সহ একটি সংমিলিত .txt নিন।
এটি কী করে?

OCR (Optical Character Recognition) টেক্সটের মতো দেখতে পিক্সেলকে প্রকৃত টেক্সটে রূপান্তর করে। এই টুল Tesseract চালায় — Google দ্বারা রক্ষণাবেক্ষণ করা ওপেন-সোর্স OCR ইঞ্জিন — WebAssembly-তে কম্পাইল করা। মুদ্রিত টেক্সটে সবচেয়ে ভাল কাজ করে; হাতের লেখা সনাক্তকরণ দুর্বল।

সেরা ফলাফলের জন্য টিপস

  • টেক্সট এবং ব্যাকগ্রাউন্ডের মধ্যে উচ্চ কনট্রাস্ট।
  • সোজা স্ক্যান — ছবি পাশ বা হেলানো থাকলে Image Cropper দিয়ে আগে ঘোরান।
  • স্ক্যান করা ডকুমেন্টের জন্য 300 DPI বা উচ্চতর।
  • মুদ্রিত টেক্সট হাতের লেখার চেয়ে অনেক ভাল কাজ করে।
  • মাল্টি-পৃষ্ঠার PDF-এর জন্য, প্রথমে PDF to JPG / PNG দিয়ে ছবিতে রূপান্তর করুন এবং প্রতিটি পৃষ্ঠা OCR করুন, অথবা ডেডিকেটেড PDF to Text টুল ব্যবহার করুন।

উদাহরণ

ইনপুট — একটি শিপিং লেবেলের স্ক্রিনশট, ইংরেজি, JPG। আউটপুট টেক্সটএরিয়া:

SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA

TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12

সাধারণ ত্রুটি ও সমস্যা

বেশিরভাগ OCR হতাশা উৎস ছবি থেকে আসে, ইঞ্জিন থেকে নয়। একটি খারাপ ছবি ফ্যান্সিয়ার সেটিং দিয়ে পুনরুদ্ধার করা যায় না।

  • নিম্ন রেজোলিউশনের ছবিতে বিকৃত আউটপুট। ফোন স্ক্রিনশট এবং ক্ষুদ্র থাম্বনেইল বিকৃত টেক্সট উৎপাদন করে। ছবি কাছ থেকে পুনরায় তুলুন, অথবা আপনার কাছে থাকলে মূল ফুল-রেজোলিউশন ফাইল ব্যবহার করুন।
  • ছবি 90° বা উল্টো ঘোরানো। Tesseract স্বয়ংক্রিয়ভাবে ঘোরায় না। প্রথমে Image Cropper দিয়ে অভিমুখিকরণ ঠিক করুন, তারপর পুনরায় চেষ্টা করুন।
  • আউটপুটে কলাম মিশে গেছে। OCR প্রাকৃতিক স্ক্যান ক্রমে পড়ে এবং মাল্টি-কলাম লেআউট বিভ্রান্ত করতে পারে। প্রথমে কলাম অনুযায়ী ছবি ক্রপ করুন, তারপর প্রতিটি কলাম আলাদাভাবে OCR করুন।
  • হাতের লেখা ভুল আসে। Tesseract মুদ্রিত টেক্সটে প্রশিক্ষিত এবং কার্সিভ বা অগোছালো হাতের লেখার সাথে লড়াই করে। পাঠযোগ্য ব্লক-অক্ষর হাতের লেখার জন্য, ফলাফল ব্যবহারযোগ্য কিন্তু কখনই দুর্দান্ত নয় — হাতে পরিষ্কার করার আশা করুন।
  • ইংরেজি-নয় টেক্সট বকবক। কোরিয়ান, আরবি, বা চাইনিজ OCR করার সময় ভাষা সিলেক্টর ইংরেজিতে রাখা এলোমেলো-দেখতে আউটপুট উৎপাদন করে। বের করার আগে ড্রপডাউন থেকে মিলানো ভাষা বাছুন।
  • বিশাল ছবিতে ট্যাব জমে যায়। 20 মেগাপিক্সেলের উপর ফটো সনাক্তকরণের সময় মেমরি শেষ করতে পারে। Image Cropper দিয়ে আপনি যে অঞ্চলে যত্ন নেন সেটিতে ক্রপ করুন, অথবা প্রথমে Image Compress দিয়ে কম্প্রেস করুন।
প্রায়শই জিজ্ঞাসিত প্রশ্ন

কোন ছবি ফর্ম্যাট সমর্থিত?

JPG, PNG, WebP, এবং BMP। আপনার ব্রাউজার স্ট্যান্ডার্ড Image API দিয়ে ডিকোড করতে পারে এমন যেকোনো ফর্ম্যাট কাজ করবে। iPhone থেকে HEIC ফটোর জন্য, HEIC to JPG টুল দিয়ে প্রথমে JPG-তে রূপান্তর করুন।

প্রথম চালনা ধীর কেন?

Tesseract-এর প্রথম ব্যবহারে প্রায় 4 MB কম্পাইল করা ইঞ্জিন কোড এবং 4 MB ভাষা মডেল ডেটা প্রয়োজন। উভয়ই আপনার ব্রাউজার দ্বারা ক্যাশ করা হয়, তাই পরবর্তী চালনা এক সেকেন্ডের কম সময়ে শুরু হয়। সনাক্তকরণ নিজেই সাধারণ স্ক্রিনশটের জন্য সাধারণত 2–10 সেকেন্ড সময় নেয় এবং ছবির আকারের সাথে প্রায় স্কেল করে।

এটি কতটা নির্ভুল?

300 DPI বা উচ্চতর পরিষ্কার মুদ্রিত টেক্সটে, নির্ভুলতা সাধারণত 95%+। ওয়েবসাইটের ফোন স্ক্রিনশটে, নির্ভুলতা সাধারণত ভাল কিন্তু ছোট UI ক্রোম মিস করতে পারে। নিম্ন রেজোলিউশনের ফটো, শব্দ সহ স্ক্যান, বা হাতের লেখায়, নির্ভুলতা উল্লেখযোগ্যভাবে কমে। আমরা দ্রুত Tesseract ভাষা ডেটা ব্যবহার করি — গতি এবং নির্ভুলতার একটি ভাল ভারসাম্য।

এটি কি ইংরেজি-নয় টেক্সট পরিচালনা করতে পারে?

হ্যাঁ — সিলেক্টর থেকে মিলানো ভাষা বাছুন। সেই ভাষায় প্রথম OCR চালনা মডেল (3–14 MB) ডাউনলোড করে এবং পরে এটি ক্যাশ করে। সমর্থিত ভাষাগুলির মধ্যে রয়েছে কোরিয়ান, চাইনিজ (সরলীকৃত এবং ঐতিহ্যগত), জাপানি, আরবি, হিন্দি, স্প্যানিশ, ফরাসি, জার্মান, পর্তুগিজ, ইতালীয়, রাশিয়ান এবং আরও অনেক কিছু। আপনি যখন প্রভাবশালী ভাষা বাছেন তখন মিশ্র-ভাষার ছবি সবচেয়ে ভাল কাজ করে।

হাতের লেখা সম্পর্কে কি?

হাতের লেখা সনাক্তকরণ দুর্বল। Tesseract মুদ্রিত টেক্সটে প্রশিক্ষিত এবং কার্সিভ বা অগোছালো লেখার সাথে লড়াই করে। পাঠযোগ্য ব্লক-অক্ষর হাতের লেখা ব্যবহারযোগ্য কিন্তু অসিদ্ধ ফলাফল উৎপাদন করে; কার্সিভ সাধারণত মোটেও কাজ করে না।

আপনি কি আমার ছবি বা বের করা টেক্সট সংরক্ষণ করেন?

না। আপনি যে ছবি ছাড়েন বা OCR যে টেক্সট উৎপাদন করে তা আমরা সংরক্ষণ করি না। ট্যাব বন্ধ বা রিফ্রেশ করলেই সব কিছু বাতিল হয় — কোনো লগ নেই, আপনি কী OCR করেছেন তার আমাদের দিকে কোনো রেকর্ড নেই। আপনি আপনার ব্রাউজারের ডেভেলপার টুল দিয়ে যাচাই করতে পারেন।