@deeptakirandas/pdf-parse NPM

@deeptakirandas/pdf-parse

Javascript cross-platform module to extract texts from PDFs.

Installation

npm i @deeptakirandas/pdf-parse

Basic Usage - Local Files

const fs = require('fs');
const pdf = require('@deeptakirandas/pdf-parse');

let dataBuffer = fs.readFileSync('path to PDF file...');

pdf(dataBuffer).then(function(data) {

	// number of pages
	console.log(data.numpages);
	// number of rendered pages
	console.log(data.numrender);
	// PDF info
	console.log(data.info);
	// PDF metadata
	console.log(data.metadata); 
	// PDF.js version
	// check https://mozilla.github.io/pdf.js/getting_started/
	console.log(data.version);
	// PDF text
	console.log(data.text); 
        
});

Basic Usage - HTTP

You can use crawler-request which uses the pdf-parse

Exception Handling

const fs = require('fs');
const pdf = require('@deeptakirandas/pdf-parse');

let dataBuffer = fs.readFileSync('path to PDF file...');

pdf(dataBuffer).then(function(data) {
	// use data
})
.catch(function(error){
	// handle exceptions
})

License

MIT licensed and all it's dependencies are MIT

pdf-parse pdf-crawler xpdf pdf.js pdfreader pdf-extractor pdf2json j-pdfjson pdf-parser pdf-extract pdf-extractor pdf-to-text pdf-text-extract pdfjs server side PDF parsing pdf metadata

debug node-ensure

@infinitebrahmanuniverse/nolb-_dee @everything-registry/sub-chunk-230 @zalastax/nolb-_dee

1.1.4

4 years ago

1.1.3

4 years ago

1.1.2

4 years ago