🔍

Search Engines

资料:张钲鸿、张翠桐、陈杰升
设计:张钲鸿、张翠桐

内容:

搜索引擎是一种在线工具,它通过索引互联网上的网页和其他内容,并根据用户提供的关键词来搜索和提供相关的结果。搜索引擎的工作原理可以概括为以下几个步骤:
  1. 爬取(Crawling): 搜索引擎使用称为“爬虫”(Crawler)或“蜘蛛”(Spider)的程序,自动地从互联网上爬取网页。爬虫会按照链接从一个网页跳转到另一个网页,逐步爬取整个互联网上的内容。
  1. 索引(Indexing): 在爬取网页的过程中,搜索引擎会提取网页的内容,并将其存储在一个巨大的索引数据库中。索引包含关键词和网页的相关信息,以便在用户搜索时能够快速检索并提供相关的结果。
  1. 检索(Retrieval): 当用户在搜索引擎中输入关键词时,搜索引擎会在索引数据库中查找包含这些关键词的网页。它会评估网页的相关性和权重,并按照一定的排序算法(如PageRank)将搜索结果进行排序。
  1. 显示结果(Displaying Results): 搜索引擎将排序后的搜索结果以列表形式呈现给用户。通常,搜索引擎会显示网页的标题、摘要和URL,让用户可以点击进入相关网页获取更多信息。

例子

不同的搜索引擎有不同的特点和商业模式。以下是一些常见的搜索引擎以及它们的盈利方式:
  1. 谷歌(Google): 作为全球最受欢迎的搜索引擎之一,谷歌主要通过广告来盈利。谷歌提供广告平台Google Ads,让广告主可以投放广告,并根据用户的搜索关键词或兴趣进行定向投放。此外,谷歌还提供其他服务,如云计算和移动操作系统,也为其带来收入。
  1. 百度(Baidu): 百度是中国最大的搜索引擎,类似于谷歌。百度的主要盈利来源是搜索广告和推广服务。它还提供了许多其他服务,如百度贴吧、百度地图和在线文库。
  1. 必应(Bing): 必应是微软公司的搜索引擎,它与谷歌竞争。必应通过广告和合作伙伴关系来实现盈利。它还与其他微软产品(如Windows操作系统和Microsoft Office套件)集成,以提供更广泛的服务。
  1. 雅虎(Yahoo): 雅虎是一家综合性互联网公司,旗下拥有搜索引擎Yahoo Search。雅虎主要通过广告、合作伙伴关系和付费服务来实现盈利。

盈利来源

搜索引擎通常通过以下方式来实现盈利:
  1. 广告: 搜索引擎是通过展示广告来实现主要收入的。它们提供广告平台,让企业和广告主可以投放广告,并根据用户的搜索关键词或兴趣进行定向投放。当用户点击广告时,广告主向搜索引擎支付费用,这种模式被称为“按点击付费”(Pay-Per-Click,简称 PPC)广告。
  1. 推广结果: 搜索引擎可能会在搜索结果页面的顶部或侧边显示一些标记为“广告”或“推广”的结果。这些结果通常是企业或组织为了获得更高的曝光率而支付给搜索引擎的。
  1. 合作伙伴关系: 搜索引擎可能与其他公司建立合作伙伴关系,例如与电子商务网站、在线服务提供商或内容提供商合作。这样的合作关系可以为搜索引擎提供分成或提供其他形式的收入。
  1. 数据分析和营销:搜索引擎会收集大量用户数据,如搜索历史、点击行为、兴趣偏好等。这些数据可以用于进行数据分析和市场研究,帮助企业了解用户需求和行为,并提供定向广告服务。
  1. 其他服务:搜索引擎可能会提供其他增值服务,如电子邮件、云存储、地图导航等,这些服务可能需要用户付费或通过订阅模式进行收费。
需要注意的是,不同的搜索引擎可能有不同的盈利模式和商业策略。一些搜索引擎可能更依赖广告收入,而其他一些可能通过多元化的业务模式来实现盈利。

隐私导向的搜索引擎(Privacy-oriented Search Engines)

隐私导向的搜索引擎是一类专注于保护用户隐私和数据安全的搜索引擎。它们采取了各种措施来减少用户的数据收集和跟踪,以保护用户的个人隐私。以下是一些隐私导向的搜索引擎及其例子:
  1. DuckDuckGo: DuckDuckGo 是最知名的隐私导向搜索引擎之一。它不会跟踪用户的搜索历史、IP 地址或个人信息,并提供匿名搜索服务。DuckDuckGo 不会根据用户的搜索行为显示个性化的广告。
  1. Startpage: Startpage 是另一个隐私导向的搜索引擎,它提供匿名搜索和搜索结果的匿名查看。它使用 Google 的搜索结果,并通过代理服务保护用户的隐私。
  1. Qwant: Qwant 是一家位于法国的隐私导向搜索引擎。它致力于保护用户的隐私,不会跟踪用户的搜索行为,并提供一个“无痕模式”以进一步加强隐私保护。
  1. SearX:SearX 是一个开源的元搜索引擎,它整合了多个搜索引擎的搜索结果,并采取严格的隐私保护措施。SearX 可以自托管(self-host),用户可以在自己的服务器上搭建 SearX 实例来加强隐私控制。
这些隐私导向的搜索引擎旨在提供更高的隐私保护,减少用户数据的收集和跟踪,并提供匿名化的搜索服务。用户可以选择使用这些搜索引擎来更好地保护自己的隐私和数据安全。

附录:

  1. "The Anatomy of a Large-Scale Hypertextual Web Search Engine" by Sergey Brin and Lawrence Page http://infolab.stanford.edu/~backrub/google.html
  1. Search Engine Optimization (SEO) Starter Guide https://developers.google.com/search/docs/fundamentals/seo-starter-guide
  1. Moz: The History of Search Engines https://moz.com/beginners-guide-to-seo/how-search-engines-operate
  1. Google: The Future of Search https://googleblog.blogspot.com/2008/09/future-of-search.html
  1. StatCounter: Search Engine Marketshare https://gs.statcounter.com/search-engine-market-share