pdfからテキストを抽出 (pdftotext , pdf2textってのもあるのか?)

どこにあるんやるとおもったら
Ubuntuの場合は poppler にあった。(ディフォでインストールされているのかな?)
CentOSはまだわからないけど、xpdfパッケージにあるのかもしらない。


poppler(pdfまわりのユーテリティ)
http://d.hatena.ne.jp/toshi_hirasawa/20081013/1223878283

 2000  which pdf2text
 2001  which xpdf
 2002  apt-cache search xpdf
 2003  apt-get install xpdf
 2004  sudo su -
 2005  cd
 2006  cd desktop
 2007  ls -tlr
 2008  pdftotext -enc utf8 -raw osc2013tokyospring-130222211440-phpapp01.pdf 
 2009  man pdftotext
 2011  pdftotext -raw osc2013tokyospring-130222211440-phpapp01.pdf 
 2014  vi osc2013tokyospring-130222211440-phpapp01.txt 
 

こちらを参考にさせてもらいました
http://www.itmedia.co.jp/help/tips/linux/l0678.html