研究生课程:现代信息检索-第0讲 课程简介

《现代信息检索》课程笔记:第0讲 课程简介

第0讲 课程简介

什么是信息检索

信息检索应用例子的共同特征:

给定需求或者是对象,从信息库中找出与之最匹配的信息或对象。

数据形式是无固定结构的自由文本(谷歌搜索)或者结构化数据(京东商品)

信息检索的定义

  1. 信息检索是给定用户需求返回满足该需求信息的一门学科。通常涉及信息的获取、存储、组织和访问。
  2. 信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。
  3. 信息检索是“找对象”的学科,即定义并计算某种匹配“相似度”的学科。

信息检索与其他的学科关系密切,包括自然语言处理、数据挖掘和机器学习。

信息检索技术广泛应用于搜索、推荐、挖掘、舆情分析、情报处理和内容安全。

从信息规模上分类,信息检索可以分为:

  1. 个人信息检索:个人相关信息的组织、整理、搜索等,包括桌面搜索、个人信息管理、个人数字记忆等
  2. 企业级信息检索:在企业内容文档的组织、管理、搜索等。企业级信息检索是内容管理的重要组成部分。
  3. Web信息检索:在超大规模数据集上的检索。

为什么要学习信息检索

  1. 用户国家、企业、个人等需要信息检索技术:互联网的信息量太大、噪音太多,寻找所需要的信息非常不容易。互联网的不只是搜索引擎才需要信息检索技术,电子商务、社交网、数字图书馆、大规模数据分析、金融证券行业等都需要信息检索技术。
  2. 公司需要信息检索技术:搜索引擎改变了很多传统的生活方式,互联网五大盈利模式或多或少都依赖信息检索技术的支撑,目前搜索引擎公司甚至整个互联网正常运转的计算广告的核心技术是信息检索技术。
  3. 应用需求:移动搜索、产品搜索、专利搜索、广告推荐、社会网络分析、消费行为分析、网络评论分析、SEO营销

信息检索学科的特点

  1. 应用性:目标非常实际,例如提升网络搜索引擎返回结果准确率、商品推荐转化率。
  2. 经验性:理论上漂亮的方法并不一定有用,理论需要结合实践。

研究生课程:现代信息检索-第0讲 课程简介
https://zhangzhao219.github.io/2022/08/29/UCAS/information-retrieval/information-retrieval-0/
作者
Zhang Zhao
发布于
2022年8月29日
许可协议