pdfからテキストを抽出 (pdftotext , pdf2textってのもあるのか?)
どこにあるんやるとおもったら
Ubuntuの場合は poppler にあった。(ディフォでインストールされているのかな?)
CentOSはまだわからないけど、xpdfパッケージにあるのかもしらない。
poppler(pdfまわりのユーテリティ)
http://d.hatena.ne.jp/toshi_hirasawa/20081013/1223878283
2000 which pdf2text 2001 which xpdf 2002 apt-cache search xpdf 2003 apt-get install xpdf 2004 sudo su - 2005 cd 2006 cd desktop 2007 ls -tlr 2008 pdftotext -enc utf8 -raw osc2013tokyospring-130222211440-phpapp01.pdf 2009 man pdftotext 2011 pdftotext -raw osc2013tokyospring-130222211440-phpapp01.pdf 2014 vi osc2013tokyospring-130222211440-phpapp01.txt
こちらを参考にさせてもらいました
http://www.itmedia.co.jp/help/tips/linux/l0678.html