《大规模元搜索引擎技》——1.4 本书概述

1.4 本书概述

本书的其余部分将专注于大规模元搜索引擎技术。现在简述其余各章。
第2章首先概述一个典型的大规模元搜索引擎的主要部件。这些部件包括搜索引擎选择器、搜索引擎加入器和结果合并器。通过对元搜索引擎和主流搜索引擎两种搜索技术优点和缺点的仔细分析,这一章试图提出充分理由来阐述元搜索引擎技术可以作为主流搜索引擎之外的另一种可行搜索技术。最后,鉴于元搜索引擎构建于Web环境,这一章将对Web环境进行讨论,进而对构建大规模元搜索引擎所面临的挑战给出一些见解。
第3章集中讨论搜索引擎选择器。对任何给定的用户查询,这个部件的目标是在元搜索引擎使用的那些搜索引擎中,确定哪个搜索引擎最有可能返回有用的结果。这一章将解决三个重要的问题:如何代表每个搜索引擎的内容;如何使用代表信息选择搜索引擎;如何生成代表信息。这一章将介绍几种类型的方法但重点讨论使用搜索词的详细统计数据来代表搜索引擎内容的方法。
第4章讨论把搜索引擎加入元搜索引擎所需的技术。将涉及两个主要问题。第一是关于元搜索引擎与其每个成员搜索引擎之间建立通信的问题。基本上,一个元搜索引擎需要把用户查询传给每个成员搜索引擎,根据每个成员搜索引擎格式要求进行必要的查询格式改变,并接收每个成员搜索引擎返回的响应页面。第二个问题是关于从响应页面提取搜索结果记录,每个记录对应于一个检索页面。这一章将介绍几种结果提取技术。
第5章介绍各种搜索结果合并算法。这些算法沿着几个维度涵盖广泛的场景。第一个维度是有关使用每个结果的何种类型信息进行合并,信息种类可从每个结果的本地排序,到每个结果的标题和概览,到每个结果的完整文档。一些合并算法同时使用多种类型的信息。第二个维度是各成员搜索引擎返回查询的文档之间的重叠度,范围可从没有重叠到有一些重叠,到完全相同的文档集。
第6章总结本书主要论述的内容,讨论元搜索引擎技术未来的发展方向,列出一些具有挑战性的有待研究的具体问题。

时间: 2024-08-02 14:10:09

《大规模元搜索引擎技》——1.4 本书概述的相关文章

《实用机器学习》——1.4 本书概述

1.4 本书概述 本书主要从解决实际问题的角度来介绍常用的机器学习算法.在1.3节中我们讨论了机器学习中常见的4类典型问题,基本上覆盖了目前实际中可以使用机器学习算法来解决的主要问题类型.在本书中,我们将主要讨论对应的4类算法,包括: 回归算法: 分类算法: 推荐算法: 排序算法. 其中回归算法和分类算法是两类最常用的算法,也是其他很多算法的基础,因此我们首先予以介绍.推荐系统在目前有了越来越多的应用,而排序算法在搜索引擎等领域也获得了广泛的应用,因此我们也会对常用的推荐算法和排序算法进行介绍.

《实用机器学习》——导读

前言 实用机器学习本书侧重于数据分析和机器学习的实践,涉及从原始数据搜集到建立模型解决问题再到算法性能评估的全过程.书中主要介绍实践中最常用的4类算法,包括回归算法.分类算法.推荐算法和排序算法.此外,书中还会介绍集成学习.集成学习是一类通过综合多个模型取长补短以取得更好效果的方法,对于回归.分类.推荐和排序问题都适用.在实践中,充分掌握这4类算法和集成学习即可解决相当多的实际问题.由于篇幅所限,聚类分析.关联规则等其他相关内容书中并没有一一介绍. 对于每种算法,本书首先介绍算法的原理.在理解算

《人工智能:计算Agent基础》——1.7 本书概述

1.7 本书概述 本书的余下部分对由复杂性维度所定义的设计空间进行探索,对每个维度进行独立的合理考虑.第2章主要分析图1-3中所提到的黑盒的内部结构,并讨论Agent的模块及层次分解.第3章主要讨论决策未来行为的最简单情况,单个Agent用显式状态推理,没有不确定性,有要完成的目标,但是存在不确定期.在这种情况下,解决目标这个问题可以抽象成图中的路径搜索问题,并介绍了如何利用本领域的额外知识进行搜索.第4.5章主要介绍如何利用特征.具体地说,第4章主要考虑怎样在给定的约束条件下找到可能的状态,这

《大规模元搜索引擎技(1)》一1.4 本书概述

1.4 本书概述 本书的其余部分将专注于大规模元搜索引擎技术.现在简述其余各章.第2章首先概述一个典型的大规模元搜索引擎的主要部件.这些部件包括搜索引擎选择器.搜索引擎加入器和结果合并器.通过对元搜索引擎和主流搜索引擎两种搜索技术优点和缺点的仔细分析,这一章试图提出充分理由来阐述元搜索引擎技术可以作为主流搜索引擎之外的另一种可行搜索技术.最后,鉴于元搜索引擎构建于Web环境,这一章将对Web环境进行讨论,进而对构建大规模元搜索引擎所面临的挑战给出一些见解.第3章集中讨论搜索引擎选择器.对任何给定

《实用机器学习》——第1章 引论

第1章 引论 实用机器学习随着计算机和互联网越来越深入到生活中的方方面面,人们搜集到的数据也呈指数级的增长.在这种情况下,大数据(big data)应运而生.大数据通常体量特别大,而且数据比较复杂,使得无法直接使用传统的数据库工具对其进行存储和管理.大数据带来了很多挑战,如数据的搜集.整理.存储.共享.分析和可视化等.广义的大数据处理涵盖了上述所有领域:狭义的大数据更多是指如何使用机器学习来分析大数据,从海量的数据中分析出有用的信息. 大数据分析的核心是机器学习算法.很多时候,我们有足够的数据,

《实用机器学习》——1.3 实际应用

1.3 实际应用 在本节中,我们将会介绍一些可用机器学习解决的实际问题,包括病人住院时间预测.信用分数估计.Netflix上的影片推荐和酒店推荐.每个例子都对应一类不同的机器学习问题.通过这些不同类型的机器学习问题,读者对机器学习可以有更多直观的感受. 1.3.1 病人住院时间预测 机器学习在医疗行业有着广泛的应用.我们以Heritage Health Prize②竞赛作为例子以说明如何使用机器学习来预测病人未来的住院时间. 在美国每年都有超过7000万人次住院.根据相关统计,2006年在护理病

《实用机器学习》——1.2 机器学习算法的分类

1.2 机器学习算法的分类 在机器学习中,常用的算法可以分为监督型学习(supervised learning)和非监督型学习(unsupervised learning)①. 在监督型学习中,除了输入数据x外,我们还知道对应的输出y.我们的目标是构建一个函数f(x),使得f(x)能够预测输出y.在非监督型学习中,我们只有输入数据x,没有对应的输出y.我们的目标是从数据中学习数据本身存在的模式(pattern).例如,聚类分析(cluster analysis)就是一个非监督型学习的典型例子,它

ExtJS 2.0 实用简明教程之布局概述_extjs

ExtJS的布局基类为Ext.layout.ContainerLayout,其它布局都是继承该类.ExtJS的容器组件包含一个layout及layoutConfig配置属性,这两个属性用来指定容器使用的布局及布局的详细配置信息,如果没有指定容器组件的layout则默认会使用ContainerLayout作为布局,该布局只是简单的把元素放到容器中,有的布局需要layoutConfig配置,有的则不需要layoutConfig配置.看代码: 复制代码 代码如下: Ext.onReady(functi

畅销榜上的机器学习、深度学习书单!

机器学习是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度等多门学科,专门研究计算机怎样模拟或实现人类的学习行为.机器学习是人工智能的核心,是使计算机具有智能的根本途径. 近年来,机器学习领域受到越来越多的关注,相关的机器学习算法开始成为热点,知乎上同类问题同样不少,如机器学习该怎么入门?机器学习.数据挖掘 如何进阶成为大神?普通程序员如何向人工智能靠拢?学习人工智能该看什么书? 今天小编整理了一些机器学习.深度学习.人工智能相关图书,涉及到的关键词如下:深度学习.Tensor