Note of Power Searching
20 Mar 2018
谷歌官方出品的如何有效使用搜索引擎的教程笔记。
基于 Daniel Russell 的Google education视频课程。
讲授了关于搜索的基本概念和技巧。
目录:
- Unit 1 - Introduction
- Unit 2 - Interpreting results
- Unit 3 - Advanced techniques
- Unit 4 - Find facts faster
- Unit 5 - Checking your facts
- Unit 6 - Putting it all together
Unit 1 - Introduction
1 Filter images results by color - 用颜色过滤图片搜索结果
图片搜索 tesla:
点击Tools增加color过滤
选择白色
将color选为灰色,type设为face
重置过滤器,将关键词改为 tesla coil
color: 紫色, size: large, usage right: Labeled for noncommercial reuse
2 How search works
When you do a google search, you aren’t actually searching the web. You’re searching google’s index of the web or at least as much of it as we can find.
- 当我们在google上进行搜索操作时,我们并不是在搜索整个网络。我们实际上是在搜索google对整个网络所生成的索引。
- google通过一种叫蜘蛛🕷的软件先从少量的网页开始获取,接着不断从一个网页跳转链接到更多网页,直至获取到整个互联网中的内容。
假设我们想搜索 how fast a cheetah can run
于是键入了3个关键词: cheetah running speed
接着google会经过这3个词对应的索引编号,拿到所有包含这3个关键词的网页,这会包含上万个结果。
最后经过过滤只会剩下200多个,google是怎样确定哪些才是目标页面?
过滤条件有:关键词在一个页面中出现的频率;关键词是否出现在网页title等主要内容中;页面中是否包含同义词;
另外一个重要的过滤条件是这个网页的质量高低,这就用到google创始人拉里佩奇提出的 PageRank算法。这个算法会计算这个网页有多少其他网页链接到它,这些外部链接的重要性多大等。
最后综合上面提到的所有因素,计算出一个网页的得分,依照这个分数返回搜索结果给用户。
关于google的广告
google对于广告和搜索结果分得很清楚
- google 不会因为对方给钱就将其网站加入索引(以增加更容易被搜索到的方式),或改变其网页的得分排名。
- google 的广告是基于你搜索内容的,他不会显示那些与你搜索内容无关的广告。
搜索 tesla coil ,页面上没有一个广告
搜索 football shoes,出现了广告
谷歌会提示有些页面可能是他猜测你想购买某类产品而显示的,甚至提醒用户可以设置屏蔽掉某些广告。
Unit 2 - Interpreting results
- Knowledge Graph panels
- Suggestion words
- Related Searches
2.1 Suggestions Search-as-you-type, Knowledge panels
Knowledge Graph panels 即搜索时可能出现在页面右边的最符合搜索关键词的重要信息。
Suggestion words 是输入关键字过程中不断出现的 autocomplete 的其他匹配搜索词。可能会提供很有用的信息,比如在你不知道完整关键词拼写时。
Related Searhes 搜索结果页面底部的相关搜索关键词,可以作为参考信息。
2.2 Thinking more deeply about your search
使用 define 关键词查看一个词的定义和过往使用频率, 只需在你需要查找的关键词前加上 define
- Sometimes search results offer information that suggests a better or additional search.
- Use [define] in the search box to identify the meaning of words.
点击definition panel可以看到该词过往的使用频率以及可能的其他信息。
Google 会在你输入的词可能存在拼写错误时提出搜索建议,作为提醒
2.3 Understand options for different media
理解不同的结果选项 web, images, news, apps, books
- Use image search when it appears in search results, and use related image search to refine results.
- Refine results by using different media types like videos and news.
多尝试不同的options会发现很多意料之外的有用信息。
2.4 Reading the search Engine Results Page(SERP)
识别一个典型的搜索结果条目的结构: 标题,网址,摘要等
学会使用 site:
关键词来限制搜索域名
2.5 Different kinds of content
跟前面提到的options重复。重点提到了 google books 和 google scholar
google scholar, 包含高级搜索功能
google books,有单独的搜索页面,但慢慢并入google play
Unit 3 - Advanced techniques
3.1 Web organization
site:
这类用来过滤结果的词称作 operator
可以限制top-level domain site:.gov
, site:.edu
, site:.com
也可以使用完整的域名 site:rubydoc.org
site:
的作用不止限于 web 结果,也可以用于 images, news 等内容过滤。
![](https://s3-ap-southeast-1.amazonaws.com/image-for-articles/image-bucket-1/Snip20180323_32.png
Filetype
使用 filetype:
来下载不同类型的文档, 比如下载kml文件(Keyhole Markup Language,一种可以与地图进行对接的文件类型)
直接点击结果的title就会开始下载
接着可以搜索my map进入google的my map页面,选择新建地图
然后将下载的文件导入地图
同样下载其他类型的文件也使用 filetype:
operator 进行
3.3 Removing invasive results
使用减号 -
,排除包含某些词汇的结果,减号和排除词之间没有空格
可以使用多个减号
michelangelo
michelangelo -artist
michelangelo -artist -gallery
也可以组合起来用
michelangelo -artist site:.edu
3.4 Using OR and quotes
- Use quotes to search for a phrase.
- Quotes glue words together; there can be additional words before or after the phrase, but the phrase will always stay together in the results. 引号中包裹的内容会被作为一个整体而搜索
- Use OR to include more than one way of expressing an idea.
- If an idea on one side of the OR is more than one word, it needs quotes around it (for example [handkerchief OR “facial tissue”])
使用引号的时候,google可能给出引号中某个单词的近似搜索结果,这时可以使用嵌套的引号
"Dannie "Rodmem" "
这样结果不会包含 Dannie Rodman, Dannie Rodmam 这样的结果,后一个词会被精确限制。
OR 的作用比较直接
"water bird" OR "bird underneath water"
这样就同时用到了引号精确匹配和OR来拓展可能的搜索描述。
3.5 intext: and Advanced Search
- Use the intext: operator to ensure the word you want is actually on the page you find.
- Use the Advanced Search user interface when appropriate.
intext:
operator
看下面这个组合搜索句法
site:stanford.edu "coral bleaching" intext:geophysics
在域名为 standord.edu
的结果中精确搜索 “coral bleaching”
然后保留页面文字内容中包含 “geophysics” 的结果
这种句法出现的原因是:
- 当我们搜索多个关键词比如 ‘term1 term2 term3’ 时,结果会找到3个词排列组合的搜索结果的合集,结果实际相对分散
- 搜索结果不只是基于网页的文本内容的,还有
<head></head>
中的一些信息,有些网站的恶意SEO可能会影响搜索准确度 intext:
operator 可以精确找到网页文字中明确包含某个词的结果- 可以和其他 operator 合用
找到 advanced search页面
通常没有出现在home page, 要先搜索,然后找到设置按钮,点击advanced。
或者使用 https://www.google.com/advanced_search
advanced search 中的form包含了很多之前提到的搜索技术,相当于这些句法的 GUI
Unit 4 - Find facts faster
4.1 Search-by-image
使用图片搜索
- Suppose you have an image, how can you figure out what it is?
- Suppose you have an image, how can you figure out where it this?
如果我有一张图片,上面的东西我不认识,我应该怎么办?如果我有一张风景照,我想知道这是哪里怎么办?
首先进入 google image 搜索页面,注意不是主页
然后将图片直接拖拽到搜索框中
比如搜索一张风景照
注意要在image搜索页面,如果在google.com页面会直接浏览图片
4.2 Search features
- Find facts quickly with shortcuts (search features).
使用
weather
+ 地址/邮编
capital
+ 国家
等词直接显示对应信息的 panel
4.3 Conversions and Calculator
- Calculate math expressions and conversions from the search box.
计算数学表达式,以及单位转换,如
76F in C
32C in F
400yard in miles
32 bushels in lters
32 bushels in barrels
32 bushels in quarts
2 inches in Angestroms
也可以直接当计算器使用
甚至可以根据给出的三角函数公式显示图形
给出复杂公式时,可能直接给出三维模型
4.4 Top menu options and Date range limiting
- Limit results to sources from a specific time period.
用时间范围限制搜索结果
搜索关键词 > 点击 search tool
> 选择时间或者点customize
选择时间段之后可以进一步点选 sort_by_date 或者 sort_by_relevance
4.5 Translation and search
如果你想搜索网页内容为指定语言的结果,比如内容是用 西班牙语 写的网页。到 advanced search 中找到 langauge 选项,选为 spanish
如果想搜索包含 ‘river dolphin’ 的西班牙语网页
- 先到tanslator中将 ‘river dolpin’ 翻译成西班牙语
- 然后再搜索翻译后的关键词
- 最后在 advanced search中限制language
language 设置为 Greek 的结果
打开一个外文网页时,一般会弹出是否翻译的提示,如果选择翻译,在浏览网页内容时,鼠标拉选的内容将会弹出对话框显示原版网页文字。
在 google translator 中如果选好了目标语言,然后粘贴一个外文网页到左边,点击右边出现的链接将会是翻译成目标语言过后的网页。
Unit 5 - Checking your facts
5.1 credibility
- Understanding ranking - it’s NOT the same as credibility 搜索排名不等于可行度排名
- Choosing appropriate terms for your query 选择合适的关键词
- You can verify credibility by looking for fact-checking sites; sites that you know to be credible. Do one more search. 可以选择你认为可信的网站搜索
5.2 Variant data
Avoid confirmation bias when conducting searches. 避免搜索时产生确认偏见倾向
- Compare various results 比较不同搜索近似关键词结果
- Identify sources 确认信息来源
- Don’t bake your answer into your query 不要在搜索关键词中隐含答案(比如:身高最高的人是250cm吗? vs 身高最高的人),注意 query 中隐含的前提或假设
- 有些问题的答案是变化的,比如世界上有多少国家?不同时期的答案是不同的。
5.3 Using Books to verify a quote
确认某句话是否出自某本书
在google book中找到书的主页,然后对书进行全文检索
比如 “Elementary my dear Watson” 是否出现在 Sherlock Holmes 写的 Arthur Conan Doyle 这本书中?
google books 中搜索 ‘Sherlock Holmes complete’ 尝试找到全集
然后找到 search inside 搜索框,输入搜索关键词
Google books中的书通常是只能看preview预览的,但却支持全书关键词搜索
5.4 Using WHOIS and looking for other site information
whois 加 网址,可以查询一个网站的拥有者信息
在所有的 unix和linux 系统的 terminal 中也有一个通用的 whois
命令
5.5 Occasionally misconceptions
算是google的免责声明
- google的customize search搜到的结果不代表google立场
- google不为广告页面背书
- 搜索排名不等于可信度/权威性
Unit 6 - Putting it all together
6.1 Combining methods
example:
filetype:kmz OR filetype:KML shipwrecks OR "ship wrecks" florida OR FL
- 首先限制了两种 文件类型
- 其次给出shipwrecks两种可能的关键词
- 以及 florida 两种可能的关键词
6.2 Thinking broadly
- Combine methods and approaches to find information efficiently.
- Color filtering in images;
- use
site:
in image search - use
OR
in News … - Finding calendars to answer day-of-the-week questions 寻找每周一问
- Using additional terms to focus in on the area of interest: 搜索任何你感兴趣的话题:
- Google language translate 使用’Google’作为首关键词搜索谷歌在这方面的动向
- planetary gear diagram 行星齿轮图
- sailing tutorial 帆船教程
- Conduct research effectively with tools that are not traditionally used for research. 使用那些传统上不会用来搜索的工具
Daniel Russell 例举了一个巨石阵的例子。如果你想看看巨石阵上的石头上的苔藓是什么样的,该怎么做?
- 使用 google map 搜索 ‘Stonehenge’ 找到定位
- 切换到卫星地图确认是否是正确地址
- 然后找到地图上的一个黄色的小人,将其拖拽下来,放到地图中靠近石阵的位置
- 地图会自动切换到三维视角
-
-
附视频参考地址:
Power Searching with Google:
https://coursebuilder.withgoogle.com/sample/course?use_last_location=true
Advanced Power Searching 是一些基于google搜索的挑战题目:
http://www.powersearchingwithgoogle.com/course/aps
另外还有较早版本的教学视频,涵盖话题更广更深,但单个视频长度也较长。
Live trainings:
https://www.google.com/intl/en-us/insidesearch/searcheducation/training.html