信息检索——于学术の海洋中快乐冲浪的终极入门指南
速度就是力量,方向是比速度更高的追求。
【最新通知】
本文虽然层次勉强明晰,也有一定实用价值,但从阅读角度来讲,文章较为松散,整体脉络并不清晰。于自己不是一篇好总结,于他人也不是一篇好教程。改革计划已经提上日程。
计划纲领如下:
1、明晰脉络,让文章简单清晰而更具操作性。
2、先写一篇统揽全局的文章,再针对各个要点开新文章,深化描写。本文主题将作为要点之一。
3、文章内容基于更大量的实践与他人经验与方法论。
信息视野
冲浪时至今日,我可以毫不犹豫地说:在绝大多数领域,处于信息链底层的众生皆韭菜。世上本没有韭菜的。人知道的东西多了,信息差拉大了,便也就有了韭菜。
众所周知,信息在传递的过程中会衰减和失真。很多好兄弟在上课的时候便会深刻体会到这点。但更令人绝望的是,对于课堂之外的各色信息,人和它们之间仿佛有着生殖隔离,不可知、不可望、不可及。本文偏重半吊子学术角度和日常实用角度去写扩张信息地图指南。
综合
老生叹道:噫嘘唏!知乎药丸,吾等可往何处去?
豆瓣?知识星球?——包括,但不限于。诸如知乎、B站、抖音等主流平台占据人们的视野。这本身不错,但仍有很多渠道通向新世界。在此我会枚举几例,码出教程。至于更宽阔的世界,则交由你来探索。
导航:聚合各种网站的网站。不论何种领域,只要有需求,就很大程度可能上有佬去搞导航。有专业的,有综合的,也有娱乐性的……360导航就是其中优秀代表。当然,如果想快速了解某个领域,你也可以进入相应导航逛逛。信息从来只是信息本身,为信息创造价值的永远是屏幕面前的你。如果有兴趣,你可以自己建一个导航,甚至去变现。以下网站建议电脑访问以获得最佳体验。
Creative Mass:创意圣地!
狼牌:工作、装机、阅读、建站……以此作为广大导航的一例。
论坛:是时代的的眼泪,还是最后的心灵家园?理想中的论坛是这样的:自由,包容,且无门槛。大家畅所欲言,愉快交流。相对于即时通讯,论坛可以翻看过往优质帖子,也基本没有大平台的恰饭引流问题。有人苦于加入各种社群而无门,而论坛可以说是选择之一。当然,想要接触真正高质的论坛,仍有门槛。这也可能是其它一些东西的映射……
小众论坛:氛围不错的技术论坛。
博客:哪个男孩不想有一个属于自己的博客呢?如今的博客,基本是兴趣使然,用爱发电。小众(?)高质,多元多彩,形容博客十分恰当。欢迎探索并收藏我的博客
播客:不以走路为目的的走路完全是浪费人生嘛随时随地,想听就听,常知常新。流程化的高效工作方案往往需要积累。让我们一起加油,成为时间管理大师!
小站:参考导航。小站,导航的核心!你永远不知道技术佬会搞出什么离谱网站
Learning Music:高哔格音乐创作入门指南。
AIDN:以Miku为主题的各种魔性小游戏。
Magi:是基于自然语言搜索的问题给出答案的新型搜索引擎,提供知识图谱服务。
公众号:文字自媒体,卷出花样,卷出高度。而可以垂直搜到文章的搜狗和微信搜索,无疑是一效率利器。如果百度不到想要的,不妨一试。甚至有时微博也能打
学术期刊:不畏浮云遮望眼,只缘身在最高层。
人肉(?):跟随同好的脚步,发现同好的世界。
学术
信息源分类
记录型信息源:由传统介质(纸张、竹、帛等)和各种现代介质(如磁盘、光盘、缩微胶卷等)记录和存贮的信息。便于保存、积累、传递和利用。
实物型信息源:由实物携带和存贮的信息,如生物样品、产品样机、工艺品、展品等。具有直观生动、易于理解等特点。需要经过分析与提炼转換为记录型信息才便于管理与传递
智力型信息源:由人脑存贮的信息,包括人们掌握的各类知识、诀窍、技能和经验,有的可用语言和文字明确表达和记录,有的则难以明确表达和记录,故又被成为隐性知识
零次型信息源:人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉包括听、视、嗅、味、触觉)的结果
文献信息源
图书、期刊、学位论文、会议文献、标准文献、专利文献、科技报告、政府出版物、产品资料、科技档案。
会议文献
分类:
会前文献(预印本、论文摘要、论文目录)→会间文献(讨论记录、情况报道)→会后文献(会议论文、会议录、讨论论文集、论文汇编、会议出版物、会议辑要、会议报告集)
特点:
- 信息传递及时,内容新颖,时效性和原创性强
- 注重学术交流
- 大多数都经过同行评议或者审稿
- 一定时间内的会议文献公开不影响专利申请的新颖性
- 出版形式多种多样,会议录、期刊、科技报告、预印本等
- 涉及的专业内容集中、针对性强。围绕同一会议主题撰写相关的研究论文
会议论文查询常用数据库:coming not soon……
学位论文
简介:
高等晥校、科研机构的毕业生为申请学位而撰写和提交的学术论文。
学士学位论文:完成一项有意义的工作
硕士学位论文:对某一课题发表独到的见解
博士学位论文:系统的创作性成果
特点:
- 选题新颖,理论性、系统性较强,阐述详
- 记录了人类大量的科研成果,真正的“百科全书”
- 参考文献多、全面,有助于对相关文献进行追踪检索
- 一般不公开出版,需图书馆购买
- 了解实验室前期工作的重要信息源
科技报告
特点:
- 反映新的科研成果迅速。以科技报告形式反映科研成果比这些成果在期刊上发表,一般要早一年左右,有的则不在期刊上发表。
- 内容多样化。它几乎涉及整个科学、技术领域和社会科学、行为科学以及部分人文科学领域
- 保密性。大量科技报告都与政府的研究活动、高新技术有关,使用范围控制较严。
- 每份报告自成册,装订简单,一般都有连续编号。
科技档案
类型:
图纸、图表、文件材料、计算材料、照片、影片以及各种录音、录像、机读磁带、光盘等
分类:
科学技术研究档案、农业技术档案、工业技术档案交通运输技术档案、基本建设档案、城市建设档案、设备仪器档案、医疗卫生档案、地质档案、测绘档案、气象档案天文档案、水文档案、地震档案、环境保护档案等
标识
J ( journal ) -期刊
M ( monograph ) 一专著
R ( report ) 一科技报告
C ( collected papers ) 一会议论文集
D ( dissertation ) 一学位论文
S ( standardization) 标准
P ( puten ) 一专利
N ( newspaper article ) 一报纸
Z其他未说明的文献类型
参考格式
数据库常用字段
信息检索
检索词
一、提取实意词。这是搜索的开始。自己体会
二、扩充检索词。
1.外文数据库中的词表。如EI、CSA、EBSCO。
2.参考数据库(见检索源)的辅助,拓展同义词、上位词、下位词、相关词。
3.搜索引擎。百度,必应,谷歌,Maji……
4.初筛后精度高质文献,自行选取关键词。不论在哪个步骤,都不能放弃思考。
检索源
其它:见1.1信息视野。
学术
主流平台:WOS、百度学术、JCR、中国知网、万方、图书馆主页
综合搜索引擎:经纶、读秀、搜递发现、iresearch、Socolar、维普
数据库
特点:
- 社会经济信息统计资源比较分散,按照专业分别归属于不同的行政部门,交叉重复的现象较多。
- 统计指标变动频繁、数据更新快,找到的数据未必完全一致,需要关注数据来源。
- 各数据库的统计指标名称没有统一的分类体系,主要靠查找分类统计指标树来获取所需信息,关键词检索功能不是很强大。
种类:
区域经济,人文社科,产业运行、金融市场、宏观经济、国际数据、能源环境、贸易外经、县市数据、普查数据
站点举例:
中华人民公国国中央人民政府网
国家统计局:不仅提供数据查询,而且可以通过导航的方式查找数据同时提供《中国统计年鉴》的在线国家统计局提供全国性、以及较为宏观的地区、行业数据。更为细化的地区、行业数据可以去各省市统计局网站、各部委网站查找
中华人民共和国海关总署:货物进出口总额、贸易差额、分贸易方式进出口额、分国别进出口额、重点商品进出口额
商务部商务数据中心:外商直接投资、对外直接投资、对外承包工程、对外劳务合作、服务贸易数据
中国人民银调查统计司:货币供应量、存款、贷款数据
中国银行保险监督管理委员会:银行业金融机构资产负债情况、商业银行拨备情况、保险公司保费、赔款及给付、赔付支出等。
国家外汇管理局:负责国际收支、对外债权债务的统计和监测
国家统计局提供主要国际数据
世界银行
世界贸易组织(WTO)
国际货币基金组织(IMF)
以及其他综合数据引擎。
一般无需具体了解每个数据库特点,能够给手上需求大致分类即可。
检索方案
搜索技巧
需要注意的是,搜索搜的不是网络,而是各平台的数据库。要灵活利用各平台的数据或语言差异,调整搜索技巧。
一、高级搜索
入口在各大搜索引擎搜索框旁边,有眼就行。
二、命令搜索
在搜索框输入各种字符,限定搜索结果。建议全文背诵
布尔逻辑检索 | 示例 | 含义 |
---|---|---|
AND | A and B | A与B的交集 |
OR | A or B | A与B的并集 |
NOT | A not B | A集除开B集的内容 |
- | Krytox157FSH-上海 | 非 |
“ ” | “stem cell” | 词组搜索 |
+ | stem cell+weight loss | 强制搜索 |
通配符 | ||
* | gene*→gene, genetics | 代表零或多个字符 |
$ | colo$r→color, colour | 代表零或一个字符 |
? | en?oblast→entobalast | 代表一个字符 |
命令 | ||
Site | Site: ustc.edu.cn /edu.cn /cn /edu/org /mil/url | 在指定网站搜索 |
Filetype | Filetype: ppt, ppts, doc, docx, xlsx, pdf, txt, | 搜索指定文件类型 |
Intitle | Intitle:Aezir很英俊,请打赏我 | 指定在标题中搜索 |
Inurl | Inurl:Aezir.ga | 在URL地址中搜索 |
Link | Link:Aezir.ga | 关联到某个网址的网站 |
Related | Related:Aezir.ga | 相关网站 |
其它 | ||
SU | SU= “ WebGIS ” and “地质灾害” and “监测预警系统” SU=( “地理信息系统” or ” GIS “ or “ WebGIS ” ) and ( “地质灾害” or ”泥石流” or ”滑坡” )and( “监测预警系统” or ”预警系统” or ”预报系统” ) |
扩充检索词与搭配 |
SAME | AD=( Tsinghua univ)SAME( key lab*)查找在记录地址”字段中存在 Tsinghua univ和 key lab的记录。 | 在地址’检索中,使用SAME将检索限制为出现在“全记录”同一地址中的检索词。 |
NEAR/x | salmon NEAR virus salmon NEAR/15 virus |
使用 NEAR/x可查找由该运算符连接的检索词之间相隔指定数量的单词的记录。 用数字取代x可指定将检索词分开的最大单词数。 |
注意 | ①算符优先级:NEAR/x-SAME-NOT-AND-OR | ②标点全为英文标点 |
三、本地搜索
推荐Everything,完爆电脑自带搜索程序。
四、搜索思路与应用
希望你能结合上述内容举一反三,创新应用场景。欢迎投稿!
五、搜索与整理工具
Search All:自由切换各种可自定义的搜索引擎,提高搜索效率。
Knower:收集你看中的网页。
SingFile:下载网页神器。
百度药丸:屏蔽广告神器。
筛选
一、质量指标
- 来源出版物:权威数据库、期刊影响分子与分区、核心期刊
- 作者、归属机构、赞助资金、国家/地区
- 文章互引网络,共引文献、被引频次
二、相关度指标
主题、相关度、relevance
三、筛选工具
- 数据库分析功能和个性设置
- 文献管理软件统计功能
四、平衡相关性和重要性
- 优先保证文献质量
- 选题保障相关度
- 注意重要文献占比
- 反思检索策略与步骤合理与否,是否阅读深入
信息管理与分析
快速学习与笔记法
讯飞语记:优质语音转文字工具。
Onenote:管理信息、多端同步、团队协作。背靠微软,服务稳定。界面优雅,布局自由,支持书写。现在新买笔电基本都会送Office四件套,包括Onenote,这意味着你能免费使用如此强大的服务。白嫖万岁
Xmind:轻度思维导图使用者的雅致工具。
Word+坚果云:大佬的究极笔记法。
学术研究
EndNoteX9:专业的文献管理工具。
总结
阅读完毕,只要知道各类搜索渠道及其特点,和一些常用搜索技巧,附加一些基本学术常识,我这篇文章就算有点价值。如果仍有疑问,兴许以下链接能够帮助你:
如何向开源社区提问题 · Issue #545 · seajs/seajs · GitHub
这是目前个人学习及实践经验总结,主要内容为MOOC“文献管理与信息分析”和万方杯学习资料的学习总结。本文或将长期更新,并将随着实践经验积累,内容更加简化且实用。
转载请注明出处。一经发现,法院传票警告。
本文仅作学习交流。如有侵权,将于24小时内删除。[doge]