PDF থেকে ছবি বের করুন

PDF-এর সমস্ত এম্বেডেড ছবি বের করুন — পৃথকভাবে অথবা .zip হিসেবে ডাউনলোড করুন। কোনো আপলোড নেই।

এখানে PDF ছাড়ুন অথবা
  1. PDF ছাড়ুন বা "ব্রাউজ করুন" ক্লিক করুন।
  2. "ছবি বের করুন" ক্লিক করুন — থাম্বনেইল গ্রিড দেখা যাবে।
  3. যেকোনো থাম্বনেইলে ক্লিক করে সেই ছবি ডাউনলোড করুন, অথবা বান্ডেলের জন্য "সব .zip হিসেবে ডাউনলোড"।
  4. ছবিগুলি PNG হিসেবে সংরক্ষিত হয়; মূল এনকোডিং প্রথমে ক্যানভাসে ডিকোড করা হয়।
এটি কী করে?

PDF-এর প্রতিটি পৃষ্ঠা স্ক্যান করে, প্রতিটি paintImageXObject অপারেশন খুঁজে বের করে এবং অন্তর্নিহিত ছবি বিটম্যাপ বের করে। প্রতিটি বের করা ছবি ক্যানভাসের মাধ্যমে PNG-তে সাধারণীকরণ করা হয় — JPEG সোর্স তাদের মূল কম্প্রেশন হারায়, কিন্তু আউটপুট পিক্সেল PDF যা রেন্ডার করেছে তার সাথে অভিন্ন। অসমর্থিত কোডেকে (JBIG2, ফ্যাক্সের জন্য CCITT, JPEG 2000-এর জন্য JPX) সংরক্ষিত ছবিগুলি গণনায় রিপোর্ট করা হয় কিন্তু ডিকোড করা হয় না — সেগুলির জন্য pdfjs-dist-এর বাইরে ডেডিকেটেড কোডেক লাইব্রেরি প্রয়োজন।

সাধারণ সমস্যা

PDF ছবি নিষ্কাশন মৌলিকভাবে কোডেক-নির্ভর। বেশিরভাগ PDF কাজ করে — এই প্যাটার্নগুলিতে নিষ্কাশন অপ্রত্যাশিত ফলাফল দিতে পারে।

  • অসমর্থিত ছবি কোডেক। JBIG2 (কিছু স্ক্যান করা ডকুমেন্ট), CCITT (ফ্যাক্স-শৈলী স্ক্যান), এবং JPEG 2000 (JPX) ডিকোড করা হয় না। স্ট্যাটাস লাইন কতগুলি এড়িয়ে যাওয়া হয়েছে তা রিপোর্ট করে। এগুলি বের করতে, পরিবর্তে /pdf-to-images এর মাধ্যমে রেন্ডার করুন — এটি ছবি সহ পুরো পৃষ্ঠা র‍্যাস্টারাইজ করে।
  • মূল JPEG গুণমান হারিয়ে যায়। স্বচ্ছতা সংরক্ষণ এবং ডবল-কম্প্রেশন আর্টিফ্যাক্ট এড়াতে ছবি PNG হিসেবে এক্সপোর্ট করা হয়। যদি আপনার সোর্স PDF-এ এম্বেড করা JPEG হয়, PNG আউটপুট বড় কিন্তু pdf-lib যা ডিকোড করেছে তার সাথে পিক্সেল-অভিন্ন।
  • ইনলাইন ছবি মিস হয়। কিছু PDF XObject-এর পরিবর্তে ইনলাইন ছবির ডেটা (BI/ID/EI অপারেটর) ব্যবহার করে — সাধারণত খুব ছোট ছবি। v1 এগুলি বের করে না। বেশিরভাগ ছবি ও স্ক্রিনশট XObjects এবং সঠিকভাবে বের করা হয়।
  • একই ছবি, একাধিকবার। PDF প্রায়ই একাধিক পৃষ্ঠা থেকে একটি ছবি XObject-এর রেফারেন্স দেয়। v1 প্রতিটি paintImageXObject কলে একবার ছবি বের করে, তাই একটি ডুপ্লিকেট লোগো প্রতিটি ব্যবহারের জন্য একবার দেখা দেবে। প্রয়োজনে ফাইলনাম বা হ্যাশ দ্বারা ডিডুপ্লিকেট করুন।
  • এনক্রিপ্টেড PDF। পাসওয়ার্ড-সুরক্ষিত PDF পাসওয়ার্ড ছাড়া খোলা যায় না। যদি আপনার মালিকের পাসওয়ার্ড থাকে তবে প্রথমে /pdf-unlock দিয়ে চালান।
  • খুব বড় PDF। প্রতিটি বের করা ছবি ব্রাউজার মেমরিতে থাকে যতক্ষণ না আপনি মুছে ফেলেন বা চলে যান। শত শত উচ্চ-রেজোলিউশনের ছবি সহ PDF 100s MB RAM ব্যবহার করতে পারে। দ্রুত .zip ডাউনলোড ব্যবহার করুন এবং কাজ শেষে মুছুন ক্লিক করুন।
প্রায়শই জিজ্ঞাসিত প্রশ্ন

আমার ছবিগুলি কেন PNG, JPG নয়?

PNG স্বচ্ছতা সংরক্ষণ করে এবং পুনরায়-এনকোডিং আর্টিফ্যাক্ট এড়ায়। পিক্সেল মূলের সাথে অভিন্ন; PNG লসলেস হওয়ায় ফাইল বড়। স্পেস বাঁচাতে, ফলাফলটি WebP মোডে /image-compress দিয়ে চালান।

প্রতিটি ছবি কোন পৃষ্ঠা থেকে এসেছে তা কীভাবে বুঝব?

ফাইলনাম `pageN-imgM.png` প্যাটার্ন অনুসরণ করে — N সোর্স পৃষ্ঠা নম্বর, M সেই পৃষ্ঠার মধ্যে ক্রম নম্বর। PDF-এ যে ক্রমে আবির্ভূত হয় তা দেখতে ফাইলনাম দ্বারা সাজান।

এনক্রিপ্টেড ছবি কি বিকৃত হয়ে বের হবে?

একটি অ-এনক্রিপ্টেড PDF-এর মধ্যে ছবির ডেটা পৃথকভাবে এনক্রিপ্ট করা থাকে না — এটি স্বাভাবিকভাবে ডিকোড হয়। যদি PDF নিজেই এনক্রিপ্টেড হয়, টুলটি এটি একেবারেই পড়তে পারে না (উপরের এনক্রিপ্টেড-PDF নোট দেখুন)।

গণনা দৃশ্যমান ছবির চেয়ে বেশি কেন?

কিছু PDF প্রতি দৃশ্যমান ছবিতে একাধিক ছবি XObjects ব্যবহার করে (যেমন, পৃথক গ্রেস্কেল ছবি হিসেবে সংরক্ষিত একটি সফট-মাস্ক আলফা চ্যানেল)। v1 প্রতিটি বের করে — সফট-মাস্ক হল যা কম্পোজিট করার সময় মূল ছবিকে সঠিক দেখায়, কিন্তু একা এটি একটি কালো-সাদা সিলুয়েট হিসেবে দেখা দেয়।

আমার PDF কি আপলোড হয়?

না। সবকিছু আপনার ব্রাউজারে চলে — আপনার PDF pdfjs-dist দ্বারা পার্স হয় এবং ছবি বিটম্যাপ ক্যানভাসের মাধ্যমে রেন্ডার হয়, সব ক্লায়েন্ট-সাইড। কোনো নেটওয়ার্ক অনুরোধ ফায়ার হয় না।

আমি কত বড় PDF থেকে বের করতে পারি?

প্রায় 100 MB PDF পর্যন্ত ব্রাউজার ধীর হতে শুরু করার আগে। হার্ড সীমা আপনার ট্যাব মেমরি — যদি নিষ্কাশন OOM হয়, /pdf-split এর মাধ্যমে PDF বিভক্ত করুন এবং প্রতিটি বিভাগ আলাদাভাবে চালান।