Question 1

এটি কি স্ক্যান করা PDF এবং শুধু-ইমেজ PDF-এ কাজ করে?

Accepted Answer

হ্যাঁ — এটাই উদ্দেশ্য। প্রতিটি পেজ একটি ছবিতে রেন্ডার হয় এবং OCR দিয়ে চালানো হয়, তাই PDF ডিজিটাল জন্মানো হোক বা স্ক্যান করা — একইভাবে কাজ করে। যেসব ডিজিটাল জন্মানো PDF-এ ইতিমধ্যে সিলেক্টযোগ্য টেক্সট আছে, সরাসরি টেক্সট-বের করার টুল দ্রুত এবং আরও সঠিক; OCR সঠিক পছন্দ যখন টেক্সট পেজ ছবিতে বেক করা থাকে।

Question 2

আমি কোন DPI বেছে নেব?

Accepted Answer

সাধারণ স্ক্যান এবং স্ক্রিনশটে OCR নির্ভুলতার জন্য 200 DPI ভালো ডিফল্ট। 150 DPI দ্রুততর কিন্তু ছোট টেক্সট হারায়। 300 DPI ঘন পেজ, ছোট ফন্ট বা নিম্ন-মানের স্ক্যানে সাহায্য করে কিন্তু রেন্ডারিং সময় এবং মেমরি ব্যবহার দ্বিগুণ করে। 300-এর উপরে যাওয়া খুব কমই সাহায্য করে যদি উৎস স্ক্যান নিজেই কম রেজোলিউশনের হয়।

Question 3

প্রথম রান কেন ধীর?

Accepted Answer

প্রথম রান এই সাইট থেকে প্রায় 8 MB OCR ইঞ্জিন এবং ইংরেজি ভাষা ডেটা ডাউনলোড করে, তারপর আপনার ব্রাউজারে ক্যাশে করে। পরবর্তী রান এক সেকেন্ডের নিচে শুরু হয়। তারপরে গতি প্রতিটি পেজ রেন্ডার এবং স্বীকৃতির দ্বারা প্রভাবিত — সাধারণত DPI এবং পেজ জটিলতার উপর নির্ভর করে প্রতি পেজে 3–10 সেকেন্ড।

Question 4

হাতের লেখা এবং অ-ইংরেজি টেক্সটের ব্যাপারে কী?

Accepted Answer

হাতের লেখা স্বীকৃতি দুর্বল — Tesseract মুদ্রিত টেক্সটে প্রশিক্ষিত এবং cursive বা অগোছালো লেখায় সংগ্রাম করে। অ-ইংরেজি টেক্সটের জন্য সিলেক্টর থেকে মিলানো ভাষা বেছে নিন; সেই ভাষায় প্রথম OCR রান মডেল ডাউনলোড করে (3–14 MB) এবং পরে ক্যাশে করে। মিশ্র-ভাষা পেজ সেরা কাজ করে যখন আপনি প্রভাবশালী ভাষা বেছে নেন।

Question 5

এটি কি পাসওয়ার্ড-সুরক্ষিত PDF হ্যান্ডেল করতে পারে?

Accepted Answer

না। এনক্রিপ্টেড PDF একটি ত্রুটির সঙ্গে লোড হতে ব্যর্থ হয়। আপনার PDF ভিউয়ারে ফাইল খুলুন, পাসওয়ার্ড দিন, এবং File > Save As-এর মাধ্যমে সুরক্ষাহীন কপি তৈরি করতে পুনরায় সংরক্ষণ করুন। তারপর সেই কপি এখানে ড্রপ করুন।

Question 6

আপনারা কি আমার PDF বা বের করা টেক্সট সংরক্ষণ করেন?

Accepted Answer

না। আপনার ড্রপ করা PDF, রেন্ডার করা পেজ ছবি, বা বের করা টেক্সট আমরা সংরক্ষণ করি না। ট্যাব বন্ধ বা রিফ্রেশ করার সঙ্গে সঙ্গেই সব মুছে যায় — কোনো লগ নেই, আপনি কী OCR করেছেন তার কোনো রেকর্ড আমাদের পক্ষে নেই। ব্রাউজারের ডেভেলপার টুলসে যাচাই করতে পারেন।

PDF থেকে টেক্সট — আপনার ব্রাউজারে OCR

উদাহরণ

সাধারণ ত্রুটি ও সমস্যা