Posted on 

信息检索——于学术の海洋中快乐冲浪的终极入门指南

速度就是力量,方向是比速度更高的追求。

【最新通知】

本文虽然层次勉强明晰,也有一定实用价值,但从阅读角度来讲,文章较为松散,整体脉络并不清晰。于自己不是一篇好总结,于他人也不是一篇好教程。改革计划已经提上日程。

计划纲领如下:

1、明晰脉络,让文章简单清晰而更具操作性。

2、先写一篇统揽全局的文章,再针对各个要点开新文章,深化描写。本文主题将作为要点之一。

3、文章内容基于更大量的实践与他人经验与方法论。

信息视野

冲浪时至今日,我可以毫不犹豫地说:在绝大多数领域,处于信息链底层的众生皆韭菜。世上本没有韭菜的。人知道的东西多了,信息差拉大了,便也就有了韭菜。

众所周知,信息在传递的过程中会衰减和失真。很多好兄弟在上课的时候便会深刻体会到这点。但更令人绝望的是,对于课堂之外的各色信息,人和它们之间仿佛有着生殖隔离,不可知、不可望、不可及。本文偏重半吊子学术角度和日常实用角度去写扩张信息地图指南。

综合

老生叹道:噫嘘唏!知乎药丸,吾等可往何处去?

豆瓣?知识星球?——包括,但不限于。诸如知乎、B站、抖音等主流平台占据人们的视野。这本身不错,但仍有很多渠道通向新世界。在此我会枚举几例,码出教程。至于更宽阔的世界,则交由你来探索。

导航:聚合各种网站的网站。不论何种领域,只要有需求,就很大程度可能上有佬去搞导航。有专业的,有综合的,也有娱乐性的……360导航就是其中优秀代表。当然,如果想快速了解某个领域,你也可以进入相应导航逛逛。信息从来只是信息本身,为信息创造价值的永远是屏幕面前的你。如果有兴趣,你可以自己建一个导航,甚至去变现。以下网站建议电脑访问以获得最佳体验。

Creative Mass:创意圣地!

狼牌:工作、装机、阅读、建站……以此作为广大导航的一例。

论坛:是时代的的眼泪,还是最后的心灵家园?理想中的论坛是这样的:自由,包容,且无门槛。大家畅所欲言,愉快交流。相对于即时通讯,论坛可以翻看过往优质帖子,也基本没有大平台的恰饭引流问题。有人苦于加入各种社群而无门,而论坛可以说是选择之一。当然,想要接触真正高质的论坛,仍有门槛。这也可能是其它一些东西的映射……

小众论坛:氛围不错的技术论坛。

博客哪个男孩不想有一个属于自己的博客呢?如今的博客,基本是兴趣使然,用爱发电。小众(?)高质,多元多彩,形容博客十分恰当。欢迎探索并收藏我的博客

播客不以走路为目的的走路完全是浪费人生嘛随时随地,想听就听,常知常新。流程化的高效工作方案往往需要积累。让我们一起加油,成为时间管理大师!

小站:参考导航。小站,导航的核心!你永远不知道技术佬会搞出什么离谱网站

Learning Music:高哔格音乐创作入门指南。

AIDN:以Miku为主题的各种魔性小游戏。

Magi:是基于自然语言搜索的问题给出答案的新型搜索引擎,提供知识图谱服务。

公众号:文字自媒体,卷出花样,卷出高度。而可以垂直搜到文章的搜狗和微信搜索,无疑是一效率利器。如果百度不到想要的,不妨一试。甚至有时微博也能打

学术期刊:不畏浮云遮望眼,只缘身在最高层。

人肉(?):跟随同好的脚步,发现同好的世界。

学术

信息源分类

记录型信息源:由传统介质(纸张、竹、帛等)和各种现代介质(如磁盘、光盘、缩微胶卷等)记录和存贮的信息。便于保存、积累、传递和利用。
实物型信息源:由实物携带和存贮的信息,如生物样品、产品样机、工艺品、展品等。具有直观生动、易于理解等特点。需要经过分析与提炼转換为记录型信息才便于管理与传递
智力型信息源:由人脑存贮的信息,包括人们掌握的各类知识、诀窍、技能和经验,有的可用语言和文字明确表达和记录,有的则难以明确表达和记录,故又被成为隐性知识
零次型信息源:人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉包括听、视、嗅、味、触觉)的结果

文献信息源

图书、期刊、学位论文、会议文献、标准文献、专利文献、科技报告、政府出版物、产品资料、科技档案。

会议文献

分类:

会前文献(预印本、论文摘要、论文目录)→会间文献(讨论记录、情况报道)→会后文献(会议论文、会议录、讨论论文集、论文汇编、会议出版物、会议辑要、会议报告集)

特点:

  1. 信息传递及时,内容新颖,时效性和原创性强
  2. 注重学术交流
  3. 大多数都经过同行评议或者审稿
  4. 一定时间内的会议文献公开不影响专利申请的新颖性
  5. 出版形式多种多样,会议录、期刊、科技报告、预印本等
  6. 涉及的专业内容集中、针对性强。围绕同一会议主题撰写相关的研究论文

会议论文查询常用数据库:coming not soon……

学位论文

简介:

高等晥校、科研机构的毕业生为申请学位而撰写和提交的学术论文。

学士学位论文:完成一项有意义的工作
硕士学位论文:对某一课题发表独到的见解
博士学位论文:系统的创作性成果

特点:

  1. 选题新颖,理论性、系统性较强,阐述详
  2. 记录了人类大量的科研成果,真正的“百科全书”
  3. 参考文献多、全面,有助于对相关文献进行追踪检索
  4. 一般不公开出版,需图书馆购买
  5. 了解实验室前期工作的重要信息源

科技报告

特点:

  1. 反映新的科研成果迅速。以科技报告形式反映科研成果比这些成果在期刊上发表,一般要早一年左右,有的则不在期刊上发表。
  2. 内容多样化。它几乎涉及整个科学、技术领域和社会科学、行为科学以及部分人文科学领域
  3. 保密性。大量科技报告都与政府的研究活动、高新技术有关,使用范围控制较严。
  4. 每份报告自成册,装订简单,一般都有连续编号。

科技档案

类型:

图纸、图表、文件材料、计算材料、照片、影片以及各种录音、录像、机读磁带、光盘等

分类:

科学技术研究档案、农业技术档案、工业技术档案交通运输技术档案、基本建设档案、城市建设档案、设备仪器档案、医疗卫生档案、地质档案、测绘档案、气象档案天文档案、水文档案、地震档案、环境保护档案等

标识

J ( journal ) -期刊
M ( monograph ) 一专著
R ( report ) 一科技报告
C ( collected papers ) 一会议论文集
D ( dissertation ) 一学位论文
S ( standardization) 标准
P ( puten ) 一专利
N ( newspaper article ) 一报纸
Z其他未说明的文献类型

参考格式

数据库常用字段

信息检索

检索词

一、提取实意词。这是搜索的开始。自己体会

二、扩充检索词。

1.外文数据库中的词表。如EI、CSA、EBSCO。

2.参考数据库(见检索源)的辅助,拓展同义词、上位词、下位词、相关词。

3.搜索引擎。百度,必应,谷歌,Maji……

4.初筛后精度高质文献,自行选取关键词。不论在哪个步骤,都不能放弃思考。

检索源

其它:见1.1信息视野。

学术

主流平台:WOS、百度学术、JCR、中国知网、万方、图书馆主页

综合搜索引擎:经纶、读秀、搜递发现、iresearch、Socolar、维普

数据库

特点:

  1. 社会经济信息统计资源比较分散,按照专业分别归属于不同的行政部门,交叉重复的现象较多。
  2. 统计指标变动频繁、数据更新快,找到的数据未必完全一致,需要关注数据来源。
  3. 各数据库的统计指标名称没有统一的分类体系,主要靠查找分类统计指标树来获取所需信息,关键词检索功能不是很强大。

种类:

区域经济,人文社科,产业运行、金融市场、宏观经济、国际数据、能源环境、贸易外经、县市数据、普查数据

站点举例:

中华人民公国国中央人民政府网

国家统计局:不仅提供数据查询,而且可以通过导航的方式查找数据同时提供《中国统计年鉴》的在线国家统计局提供全国性、以及较为宏观的地区、行业数据。更为细化的地区、行业数据可以去各省市统计局网站、各部委网站查找

中华人民共和国海关总署:货物进出口总额、贸易差额、分贸易方式进出口额、分国别进出口额、重点商品进出口额

商务部商务数据中心:外商直接投资、对外直接投资、对外承包工程、对外劳务合作、服务贸易数据

中国人民银调查统计司:货币供应量、存款、贷款数据

中国银行保险监督管理委员会:银行业金融机构资产负债情况、商业银行拨备情况、保险公司保费、赔款及给付、赔付支出等。

国家外汇管理局:负责国际收支、对外债权债务的统计和监测

国家统计局提供主要国际数据

世界银行

世界贸易组织(WTO)

国际货币基金组织(IMF)

以及其他综合数据引擎。

一般无需具体了解每个数据库特点,能够给手上需求大致分类即可。

检索方案

搜索技巧

需要注意的是,搜索搜的不是网络,而是各平台的数据库。要灵活利用各平台的数据或语言差异,调整搜索技巧。

一、高级搜索

入口在各大搜索引擎搜索框旁边,有眼就行。

二、命令搜索

在搜索框输入各种字符,限定搜索结果。建议全文背诵

布尔逻辑检索 示例 含义
AND A and B A与B的交集
OR A or B A与B的并集
NOT A not B A集除开B集的内容
- Krytox157FSH-上海
“ ” “stem cell” 词组搜索
+ stem cell+weight loss 强制搜索
通配符
* gene*→gene, genetics 代表零或多个字符
$ colo$r→color, colour 代表零或一个字符
en?oblast→entobalast 代表一个字符
命令
Site Site: ustc.edu.cn /edu.cn /cn /edu/org /mil/url 在指定网站搜索
Filetype Filetype: ppt, ppts, doc, docx, xlsx, pdf, txt, 搜索指定文件类型
Intitle Intitle:Aezir很英俊,请打赏我 指定在标题中搜索
Inurl Inurl:Aezir.ga 在URL地址中搜索
Link Link:Aezir.ga 关联到某个网址的网站
Related Related:Aezir.ga 相关网站
其它
SU SU= “ WebGIS ” and “地质灾害” and “监测预警系统”
SU=( “地理信息系统” or ” GIS “ or “ WebGIS ” ) and ( “地质灾害” or ”泥石流” or ”滑坡” )and( “监测预警系统” or ”预警系统” or ”预报系统” )
扩充检索词与搭配
SAME AD=( Tsinghua univ)SAME( key lab*)查找在记录地址”字段中存在 Tsinghua univ和 key lab的记录。 在地址’检索中,使用SAME将检索限制为出现在“全记录”同一地址中的检索词。
NEAR/x salmon NEAR virus
salmon NEAR/15 virus
使用 NEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。
用数字取代x可指定将检索词分开的最大单词数。
注意 ①算符优先级:NEAR/x-SAME-NOT-AND-OR ②标点全为英文标点

三、本地搜索

推荐Everything,完爆电脑自带搜索程序。

四、搜索思路与应用

希望你能结合上述内容举一反三,创新应用场景。欢迎投稿!

五、搜索与整理工具

Search All:自由切换各种可自定义的搜索引擎,提高搜索效率。
Knower:收集你看中的网页。
SingFile:下载网页神器。
百度药丸:屏蔽广告神器。

筛选

一、质量指标

  1. 来源出版物:权威数据库、期刊影响分子与分区、核心期刊
  2. 作者、归属机构、赞助资金、国家/地区
  3. 文章互引网络,共引文献、被引频次

二、相关度指标

主题、相关度、relevance

三、筛选工具

  1. 数据库分析功能和个性设置
  2. 文献管理软件统计功能

四、平衡相关性和重要性

  1. 优先保证文献质量
  2. 选题保障相关度
  3. 注意重要文献占比
  4. 反思检索策略与步骤合理与否,是否阅读深入

信息管理与分析

快速学习与笔记法

讯飞语记:优质语音转文字工具。

Onenote:管理信息、多端同步、团队协作。背靠微软,服务稳定。界面优雅,布局自由,支持书写。现在新买笔电基本都会送Office四件套,包括Onenote,这意味着你能免费使用如此强大的服务。白嫖万岁

Xmind:轻度思维导图使用者的雅致工具。

Word+坚果云:大佬的究极笔记法。

学术研究

EndNoteX9:专业的文献管理工具。

总结

阅读完毕,只要知道各类搜索渠道及其特点,和一些常用搜索技巧,附加一些基本学术常识,我这篇文章就算有点价值。如果仍有疑问,兴许以下链接能够帮助你:

别像弱智一样提问

如何向开源社区提问题 · Issue #545 · seajs/seajs · GitHub

如何向开源项目提交无法解答的问题 - 知乎

百度使用教程

这是目前个人学习及实践经验总结,主要内容为MOOC“文献管理与信息分析”和万方杯学习资料的学习总结。本文或将长期更新,并将随着实践经验积累,内容更加简化且实用。

转载请注明出处。一经发现,法院传票警告。

本文仅作学习交流。如有侵权,将于24小时内删除。[doge]


本站由 @Aezir 使用 Stellar 主题创建。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。