PDF থেকে টেক্সট — আপনার ব্রাউজারে OCR
স্ক্যান করা বা ইমেজ-ভিত্তিক PDF থেকে পেজ ধরে ধরে টেক্সট বের করুন। প্রতিটি পেজ একটি ইমেজে রেন্ডার করা হয় এবং আপনার ব্রাউজারে OCR চালানো হয়।
- এক বা একাধিক PDF ড্রপ করুন, বা ব্রাউজ ক্লিক করুন।
- একটি DPI বেছে নিন। 200 ভালো ডিফল্ট; ঘন বা ছোট-ফন্ট পেজে 300-তে বাড়ান।
- ঐচ্ছিকভাবে 1-3, 5, 8-10-এর মতো রেঞ্জ দিয়ে পেজ সীমাবদ্ধ করুন; একই রেঞ্জ প্রতিটি PDF-এ প্রয়োগ হয়। প্রতিটি ফাইলের প্রতিটি পেজ OCR করতে খালি রাখুন।
- "সব বের করুন" ক্লিক করুন। প্রথম রান এই সাইট থেকে প্রায় 8 MB OCR ইঞ্জিন এবং ভাষা ডেটা ডাউনলোড করে (পরের বারের জন্য আপনার ব্রাউজার ক্যাশে করে, ব্যাচের প্রতিটি PDF-এ পুনরায় ব্যবহৃত)।
- প্রথম PDF-এর টেক্সট নিচের প্রিভিউতে দেখায় (প্রথম 3 পেজ)। প্রতিটি ফাইলের পূর্ণ টেক্সট তার সারি থেকে ডাউনলোড করুন, প্রতিটি ফাইলের আউটপুট ক্লিপবোর্ডে কপি করুন, বা একটি সম্মিলিত .txt নিন।
এটি কী করে?
প্রতিটি নির্বাচিত পেজ আপনার বেছে নেওয়া DPI-তে একটি canvas-এ রেন্ডার হয়, তারপর Tesseract — Google-এর দ্বারা রক্ষণাবেক্ষিত ওপেন-সোর্স OCR ইঞ্জিন — WebAssembly-তে কম্পাইল করা, দিয়ে চালানো হয়। প্রতিটি পেজের স্বীকৃত টেক্সট একটি একক আউটপুটে একত্রিত করা হয়, পেজের মধ্যে --- Page N --- সেপারেটর সহ, যাতে আপনি যেকোনো প্যাসেজ তার উৎস পেজে ফিরে খুঁজে পান।
উদাহরণ
Input — একটি স্ক্যান করা 2 পেজের মেমো, 200 DPI, সব পেজ। আউটপুট টেক্সট এরিয়া:
--- Page 1 ---
MEMO
To: All Staff
From: Operations
Date: April 12, 2026
Subject: Friday parking changes
Starting this Friday, the east lot
will be closed for resurfacing…
--- Page 2 ---
…overflow parking is available in
Lot C for the duration of the work.
Questions should be directed to
[email protected]. সাধারণ ত্রুটি ও সমস্যা
বেশিরভাগ OCR হতাশা উৎস ডকুমেন্ট থেকে আসে, ইঞ্জিন থেকে নয়। একটি খারাপ স্ক্যান উচ্চতর DPI দিয়ে পুনরুদ্ধার করা যায় না।
- নিম্নমানের স্ক্যানে বিকৃত আউটপুট। প্রায় 150 DPI-এর নিচের উৎস ছবি, আপনি এখানে যাই সেট করুন না কেন, বিকৃত টেক্সট তৈরি করে। 300 DPI-তে পুনরায় স্ক্যান করুন, বা যদি থাকে মূল ডিজিটাল ফাইল ব্যবহার করুন।
- আউটপুটে কলাম মিশে যাচ্ছে। OCR প্রাকৃতিক স্ক্যান ক্রমে পড়ে এবং মাল্টি-কলাম লেআউটে বিভ্রান্ত হতে পারে। প্রথমে পেজ রেন্ডারে Image Cropper দিয়ে PDF-কে কলাম অনুসারে ভাগ করুন, তারপর প্রতিটি কলাম আলাদা OCR করুন।
- পেজ 90° বা উল্টো ঘুরানো। Tesseract স্বয়ংক্রিয় ঘোরানো করে না। প্রথমে PDF Organizer দিয়ে PDF-এর ওরিয়েন্টেশন ঠিক করুন, তারপর পুনরায় চেষ্টা করুন।
- বড় PDF-এ ট্যাব জমে যাচ্ছে। 300 DPI-তে 100-এর বেশি পেজ মেমরি শেষ করে দিতে পারে। গুণমান নিশ্চিত করতে প্রথমে একটি পেজ রেঞ্জ রেন্ডার করুন (যেমন 1-25), তারপর বাকিটা ব্যাচে করুন। আপনার ডিভাইসের মেমরি সীমিত হলে 200 DPI-তে নামান।
- অবৈধ রেঞ্জ। Invalid range: "1 through 5" — শুধু হাইফেন এবং কমা সাপোর্টেড। 1-5 ফরম্যাট ব্যবহার করুন।
- এনক্রিপ্টেড PDF। পাসওয়ার্ড-সুরক্ষিত PDF লোড হতে ব্যর্থ হয়। File > Save As-এর মাধ্যমে আপনার PDF ভিউয়ারে আনলক করুন, তারপর সুরক্ষাহীন কপি দিয়ে পুনরায় চেষ্টা করুন।
প্রায়শই জিজ্ঞাসিত প্রশ্ন
এটি কি স্ক্যান করা PDF এবং শুধু-ইমেজ PDF-এ কাজ করে?
হ্যাঁ — এটাই উদ্দেশ্য। প্রতিটি পেজ একটি ছবিতে রেন্ডার হয় এবং OCR দিয়ে চালানো হয়, তাই PDF ডিজিটাল জন্মানো হোক বা স্ক্যান করা — একইভাবে কাজ করে। যেসব ডিজিটাল জন্মানো PDF-এ ইতিমধ্যে সিলেক্টযোগ্য টেক্সট আছে, সরাসরি টেক্সট-বের করার টুল দ্রুত এবং আরও সঠিক; OCR সঠিক পছন্দ যখন টেক্সট পেজ ছবিতে বেক করা থাকে।
আমি কোন DPI বেছে নেব?
সাধারণ স্ক্যান এবং স্ক্রিনশটে OCR নির্ভুলতার জন্য 200 DPI ভালো ডিফল্ট। 150 DPI দ্রুততর কিন্তু ছোট টেক্সট হারায়। 300 DPI ঘন পেজ, ছোট ফন্ট বা নিম্ন-মানের স্ক্যানে সাহায্য করে কিন্তু রেন্ডারিং সময় এবং মেমরি ব্যবহার দ্বিগুণ করে। 300-এর উপরে যাওয়া খুব কমই সাহায্য করে যদি উৎস স্ক্যান নিজেই কম রেজোলিউশনের হয়।
প্রথম রান কেন ধীর?
প্রথম রান এই সাইট থেকে প্রায় 8 MB OCR ইঞ্জিন এবং ইংরেজি ভাষা ডেটা ডাউনলোড করে, তারপর আপনার ব্রাউজারে ক্যাশে করে। পরবর্তী রান এক সেকেন্ডের নিচে শুরু হয়। তারপরে গতি প্রতিটি পেজ রেন্ডার এবং স্বীকৃতির দ্বারা প্রভাবিত — সাধারণত DPI এবং পেজ জটিলতার উপর নির্ভর করে প্রতি পেজে 3–10 সেকেন্ড।
হাতের লেখা এবং অ-ইংরেজি টেক্সটের ব্যাপারে কী?
হাতের লেখা স্বীকৃতি দুর্বল — Tesseract মুদ্রিত টেক্সটে প্রশিক্ষিত এবং cursive বা অগোছালো লেখায় সংগ্রাম করে। অ-ইংরেজি টেক্সটের জন্য সিলেক্টর থেকে মিলানো ভাষা বেছে নিন; সেই ভাষায় প্রথম OCR রান মডেল ডাউনলোড করে (3–14 MB) এবং পরে ক্যাশে করে। মিশ্র-ভাষা পেজ সেরা কাজ করে যখন আপনি প্রভাবশালী ভাষা বেছে নেন।
এটি কি পাসওয়ার্ড-সুরক্ষিত PDF হ্যান্ডেল করতে পারে?
না। এনক্রিপ্টেড PDF একটি ত্রুটির সঙ্গে লোড হতে ব্যর্থ হয়। আপনার PDF ভিউয়ারে ফাইল খুলুন, পাসওয়ার্ড দিন, এবং File > Save As-এর মাধ্যমে সুরক্ষাহীন কপি তৈরি করতে পুনরায় সংরক্ষণ করুন। তারপর সেই কপি এখানে ড্রপ করুন।
আপনারা কি আমার PDF বা বের করা টেক্সট সংরক্ষণ করেন?
না। আপনার ড্রপ করা PDF, রেন্ডার করা পেজ ছবি, বা বের করা টেক্সট আমরা সংরক্ষণ করি না। ট্যাব বন্ধ বা রিফ্রেশ করার সঙ্গে সঙ্গেই সব মুছে যায় — কোনো লগ নেই, আপনি কী OCR করেছেন তার কোনো রেকর্ড আমাদের পক্ষে নেই। ব্রাউজারের ডেভেলপার টুলসে যাচাই করতে পারেন।