如何搜索pdf媒体文件?

时间:2011-10-02 作者:user3047

我有一个拥有合理数量pdf文件的博客。搜索pdf文件时,如何让wordpress查看pdf文件?

谢谢

2 个回复
SO网友:Jono Warren

内置的WordPress搜索不会索引PDF文件内容,但是Google会索引,在replacing WordPress search with Google Custom Search.

SO网友:VicePrez

您可以使用开源实用程序,xpdf, 将pdf文件转换为平面文本文件,并像搜索其他文本文件一样进行搜索。不过,并入WordPress是另一件需要担心的事情。

我在Mac上使用它从公司的季度财务报表中提取数据。你可以在Mac OS X下安装,如果你有MacPorts 已安装。

port install xpdf
然后需要使用该实用程序xpdf-pdftotext 将pdf文件转换为纯文本文件。

您可以简单地将结果作为变量存储在PHP中

$file_name = \'/usr/local/src/file1.pdf\';

// On Mac the utility is called xpdf-pdftotext, and pdftotext on Linux I believe

if (file_exists($file_name)) {
    $file_contents = shell_exec("/opt/local/bin/xpdf-pdftotext $filename - 2>&1");

    echo $file_contents;
}
如果要安装xpdf 从源头上,其可在website, 它同时提供Linux和Windows版本。

查看xpdf man pages 为了了解实用程序,他们为不同的应用程序提供了不同的工具。以下是pdftotext 公用事业

祝你好运。

结束

相关推荐

tag search using WP_Query

我只需要找到带有标签的帖子forest gump. 我尝试过:new WP_Query(\'tag=forest+gump\');, new WP_Query(\'tag=forest gump\');. 然而,他们都会返回所有的帖子,而不仅仅是带有forest gump 标签但是,单个标记(没有空格)可以正常工作。替代方案(如普通SQL)也可以使用。入口标记行为forest gump, forrest gump, questend.