在自己的电脑上运行搜索引擎程序

2008年11月11日 由 SunQ 留言 »

Google又做了一件有利于全人类的事情……

看这里,Google中国黑板报刚刚发布的消息

谷歌公司的使命是整合全球信息,使人人皆可访问并从中受益。对于那些防火墙背后,谷歌的搜索爬虫接触不到的信息,我们提供了谷歌搜索服务器(Google Search Appliance,以下简称GSA)软硬件整体解决方案。GSA 能够对企业、高校等拥有的网页、文档、数据库等相关信息进行高效安全的通用搜索,支持的文件格式达 220 余种。随着 GSA 最新的 5.2 版的发布,我们在全球同时发布了一个运行在虚拟机中的纯软件版的 GSA ——谷歌搜索服务器虚拟版(Google Search Appliance virtual edition,以下简称 GSAve)。
今天,全世界的技术爱好者可以免费从这里下载 GSAve,在自己的计算机上运行自己的搜索引擎,使用它来抓取和索引自己的网站、博客、数据库和网络文件夹。
GSAve 秉承了 GSA 强大的搜索功能和编程接口。谷歌鼓励广大程序员使用 GSAve 提供的接口来开发一些有趣的适合特殊内网环境的搜索体验。
– 使用连接器管理工具,可以让 GSAve 抓取和索引到非 Web 形式的网络资源,例如存放在Sharepoint 中的文档。
– 使用 Feed API 和元数据搜索功能,您可以为自己的网络论坛(BBS)建立搜索功能。
– 您可以使用 Onebox 编程接口在搜索结果页面中提供实时数据。
– GSA 强大的安全搜索功能支持多种身份认证方式,使用户在搜索结果中只见到自己有权限访问的文档。
– 我们专门为小规模文档集设计了专门的网页排序算法。
– 用户可以定制 GSA 的搜索结果界面,甚至以 XML 格式的形式,来整合到您自己的应用中去。

是不是很诱惑?我也被诱惑到了,于是我访问了GSAve的下载页面,于是我被雷到了:

System Requirements

The following system resources are required:

  • Intel® Pentium® 4 Processor 2.80 Ghz with HT or equivalent
  • 3 GB of RAM
  • 40 GB of free space on hard disk
  • Ethernet connection

The following system resources are recommended:

  • Intel Pentium D processor 915 (dual core) or equivalent
  • 4 GB of RAM
  • 40 GB of free space on a 7200 RPM or faster hard disk
  • Serial ATA storage interface or better
  • Ethernet connection

最低配置竟然还需要3G的内存,40G的硬盘空间,推荐的配置是4G的内存+40G的7200RPM硬盘,反正我的电脑是达不到这个要求,我的电脑升级之后才仅仅是1.5G的内存呢。

不过,最终我还是搞明白了,这个发布于Google Code上的东西,是给牛人们研究用的,看介绍就很明了了:“The number of documents crawled and indexed is limited to 50,000

”,文档索引的限制是在5万,相信现在很少有人的电脑里面的文档数量少于50,000的吧。

而对于我们这些不牛的人,用Google 桌面搜索要远比用这个好得多……

广告位
~~~广告位招商中~~~

3 条评论

  1. simpleseo说道:

    这东西很有个人用户使用的,除非你专门弄台服务器。

  2. 花果山寨说道:

    呵呵!google可不是吃素的!

  3. Eden说道:

    换主题了。