信息检索

概念:信息检索是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。

信息检索有广义和狭义之分

广义的信息检索是信息按一定的方式进行加工、整理、组织并存储起来,再根据用户特定的需要将相关信息准确地查找出来的过程。因此,也称为信息的存储与检素

狭义的信息检索仅指信息查询,即用户根据需要,采用某种方法或借助检索工具,从信息集合中找出所需要的信息

检索类型

按存储与检索对象划分:信息检索可以分为文献检索、数据检索、事实检索。

数据检索和事实检索是检索出包含在文献中的信息本身,而文献检索是检索出包含所需要信息的文献即可。

按存储的载体和实现查找的技术手段划分:信息检索可以分为手工检索、机械检索、计算机检索。

按检索途径划分:信息检索可以分为直接检索和间接检索。

常用的信息检索技术

布尔逻辑检索

位置检索

截词检索

字段限制检索

搜索引擎

概念:搜索引擎是指根据一定的策略,运用特定的计算机程序从互联网上搜集信息在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。它包括信息搜索、信息整理和用户查询3部分。

搜索引擎分类

全文搜索引擎

目录式搜索引擎

元搜索引擎

信息素养

概念:信息素养的重点是内容传播、分析,包括信息检索以及评价,涉及更宽的方面。它是一种了解、搜集、评估和利用信息的知识结构,既需要熟练的信息技术,也需要完善的调查方法,通过鉴别和推理来完成。信息素养是一种信息能力,信息技术是它的一种工具。

特点:文化层面、信息意识、信息技能

要素:信息意识、信息知识、信息能力(最核心的组成部分)、信息道德

信息伦理

概念:信息伦理是指涉及信息开发、信息传播、信息的管理和利用等方面的伦理要求、伦理准则伦理规约,以及在此基础上形成的新型伦理关系。信息伦理又称信息道德,它是调整人们之间以及个人和社会之间信息关系的行为规范的总和。

三个层次:信息道德意识、信息道德关系、信息道德活动

职业文化

概念:所谓职业文化,是指人们在职业活动中逐步形成的价值理念、行为规范、思维方式的总称,以及相应的礼仪、习惯、气质与风气,其核心内容是对职业有使命感,有职业荣誉感和良好的职业心理,遵循一定的职业规范以及对职业礼仪的认同和遵从。

信息安全

概念:信息安全是指信息系统受到保护,不会出于偶然的或者恶意的原因而遭到破坏、更改、泄露,系统连续、可靠、正常运行,信息服务不中断,最终实现业务的连续性。

自主可控是保障网络安全、信息安全的前提

ITSEC阐述和强调了信息安全的CIA三元组目标, 即保密性( Confidentiality)、完整性( Integrity)和可用性( Availability)。

2017年《中华人民共和国网络安全法》实施

安全要素

身份认证:服务方式有同层实体身份认证、数据源身份认证、同层实体相互身份认证

访问控制:限制访问主体对访问客体的访问权限

数据保密:确保信息在存储、传输及使用过程中不被未授权的实体访问,导致信息泄露

数据完整:确保信息在存储、传输及使用过程中不被未授权的实体更改或者破坏

不可否认:防备两个实体中的任一实体否认执行过的操作

安全威胁

计算机病毒:特征有潜伏性、传染性、突发性、隐蔽性、破坏性等

黑客

网络犯罪

预置陷阱:分为硬件陷阱和软件陷阱

垃圾信息

隐私泄露

安全防御技术

加密技术:保护网内的数据、文件、口令和控制信息,保护网上传输的数据。主要有数据传输加密和数据存储加密

防火墙:防火墙技术是指一个由软件和硬件设备组合而成,在内部网和外部网之间、专用网与公共网之间的一道防御系统的总称,是一种获取安全性方法的形象说法。

​ 目的:限制他人进入内部网络、防止入侵者接近防御设施、限定用户访问特殊站点、监视Internet 安全提供方便

入侵检测:对于网络活动进行实时监测的专用系统

系统容灾:基于数据备份和基于系统容错的系统容灾技术

机器人自动化

概念:机器人流程自动化(robotic process automation)是以软件机器人和人工智能为基础的业务过程自动化科技,通过模仿用户手动操作的过程,让软件机器人自动执行大量重复的、基于规则的任务,将手动操作自动化的技术。

发展阶段

  1. RPA 1.0阶段(辅助性RPA)
  2. RPA 2.0阶段(非辅助性RPA)
  3. RPA 3.0阶段(自主性RPA)
  4. RPA 4.0阶段(认知性RPA)

技术架构:

典型的 RPA 平台至少包含开发、运行、控制等三个组成部分,俗称 RPA 三件套。

  • 开发工具
  • 运行工具
  • 控制中心

主流厂商

海外巨头以 UiPath、Automation Anywhere、Blue Prism 三家公司为代表,掀起 RPA 浪潮。

国内:艺赛旗、弘玑、达观数据和云扩科技等。

大数据

概念:大数据是以多元形式从许多来源搜集而成的庞大的数据集合。

4V特征:Volume(大量)、 Velocity(高速)、Variety(多样)、Value(低价值密度)。

5V特征:Volume(大量)、 Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(准确性)

大数据的采集

大数据采集常用ETL技术:抽取(extract)、转换(transform)、加载(load)

大数据预处理

数据清洗:目的在于提高数据质量,将脏数据清洗干净,使原数据具有完整性、唯一性、权威性、合法性、一致性等特点

数据集成:将互相关联的分布式异构数据源集成到一起,使用户能够以透明的方式访问这些数据源

数据规约:目的就是从原有庞大数据集中获得一个精简的数据集合,并使这精简数据集保持原有数据集的完整性,这样在精简数据集上进行数据挖掘显然效率更高,并且挖掘出来的结果与使用原有数据集所获得结果是基本相同。数据规约包括维归约、数量归约和数据压缩。

数据变换:数据变换是指对数据进行变换处理,使数据更适合当前任务或者算法的需求

大数据的分析

  • 可视化分析
  • 数据挖掘算法
  • 预测性分析能力
  • 语义引擎
  • 数据质量和数据管理

人工智能

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

特征:全新交互方式、自进化和去节点化

人工智能的发展阶段

萌芽期(1956年以前),以申农为首的科学家共同研究了机器模拟的相关问题,人工智能正式诞生;

第一发展期(黄金期 1956-1974),上世纪60年代是人工智能的第一个发展黄金阶段,该阶段的人工智能主要以语言翻译、证明等研究为主;

瓶颈期(1974-1980),上世纪70年代经过科学家深入的研究,发现机器模仿人类思维是一个十分庞大的系统工程,难以用现有的理论成果构建模型;

第二发展期(繁荣期 1980-1987),已有人工智能研究成果逐步应用于各个领域,人工智能技术在商业领域取得了巨大的成果;

崛起期(1993-至今),随着互联网技术的逐渐普及,人工智能已经逐步发展成为分布式主体,为人工智能的发展提供了新的方向。

机器学习

概念:机器学习(Machine Learning)是一门涉及统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等诸多领域的交叉学科,研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,是人工智能技术的核心。

训练方法:监督式学习、半监督式学习、无监督式学习、强化学习

云计算

云计算(cloud computing)是在分布式计算、并行计算、网格计算、网络存储、虚拟化、网络技术等传统技术的基础上融合发展起来的产物,它是一个概念,而不是指具体的技术或者标准,不同的人、不同的领域从不同的角度出发对云计算有不同的理解,业界对云计算的定义也没有一个统一的标准。目前,随着技术的发展,人们对云计算的认识也在不断发展变化

特点:规模庞大、虚拟化、可扩展性强、通用性好、可靠性高、按需服务、节约成本、具有潜在的危险性

服务模式

基础设施及服务 (IaaS)

平台及服务(PaaS)

软件及服务(SaaS)

部署模式

公有云、私有云、混合云

关键技术

分布式计算:就是把一个需要大量计算才能解决的复杂问题分解成许多小的任务,然后把这些小任务分配给网络上多个闲置的计算机分别进行处理,最后把这些计算结果综合起来得到最终的计算结果。这种计算模式可以在多台计算机上共享稀有资源和平衡负载,缩短整体计算时间,大大提高计算效率

分布式数据存储技术:分布式数据存储就是将数据分散存储到多个数据存储服务器上。

虚拟化技术:通过虚拟化技术可以实现将所有硬件设备、软件应用和数据隔离开,打破硬件配置、软件部署和数据分布的界限,实现Ⅳ架构的动态化,实现资源的统一管理和调度,使应用能够动态地使用虚拟资源和物理资源,提高资源的利用率和灵活性。

数据管理技术:云计算需要对分布在不同服务器上的海量的数据进行分析和处理,因此,数据管理技术必须能够高效稳定地管理大量的数据。

现代通信技术

将信号在时间或空间进行交换和有效传递的过程称为通信,真正实现信息快速、准确、高效、远距离的传输。

通信系统要素

信源:通信过程中产生和发送信息的设备或计算机。信源,理解成信息的源泉,英文是 feed 。信息发布网站将网站全部或者部分信息整合到一个RSS 文件中,这个文件就被称之为 feed 。

通信媒体:又称传输媒介,它是通信传输系统中发方与收方之间的物理路径,也是通信系统的重要组成部分之一。在某种意义上说,通信传输的特性和质量取决于信号本身和传输媒体的特性。

信宿:是相对于信源而言的。信宿是信息动态运行一个周期的最终环节。其功能是接收情报信息,并选择对自身有用的信息加以利用,直接或间接地为某一目的服务。

通信技术的发展历程

  • 第一阶段是语言和文字通信阶段(古代通信) 如:飞鸽传书、烽火传讯、信件等。
  • 第二阶段是电通信阶段 (近代通信)如:电报、电话
  • 第三阶段是电子信息通信阶段(当代通信)如:超高清视频、虚拟现实、云计算等。

现代通信技术的发展趋势(五化)

  • 通信业务综合化
  • 网络互通融合化
  • 通信传送宽带化
  • 网络管理智能化
  • 通信网络泛在化

移动通信技术

移动通信沟通移动用户与固定点用户之间或移动用户之间的通信方式。

移动通信技术经过第一代、第二代、第三代、第四代技术的发展,目前,已经迈入第五代发展的时代(5G 移动通信技术),以 5G 为代表的现代通信技术是中国新型基础设施建设的重要领域,满足智能终端的快速普及和移动互联网的高速发展。

5G技术

移动通信延续着每十年一代技术的发展规律,每一次代际跃迁,每一次技术进步,都极大地促进了产业升级和经济社会发展。随着移动互联网快速发展,新服务、新业务不断涌现,移动数据业务流量爆炸式增长,5G 的毫秒级延迟将开启一个万物互联、万物智联时代。

特点:高速率、低时延、低功耗、高可靠性

组网技术:NSA、SA

5G 关键技术

  • 高频毫米波传输
  • Massive MIMO天线技术(超大规模阵列天线技术)
  • D2D技术(终端直通技术)
  • MEC技术(多接入边缘技术)
  • UDN技术(超密集组网技术)
  • 双连接技术

物联网

“万物相连的互联网”,是在互联网基础上的延伸和扩展的网络,通过将各种信息传感设备与网络结合起来而形成的一个巨大网络,实现在任何时间、任何地点,人、机、物的互联互通。

特征:全面感知、可靠传输和智能处理

体系结构

物联网的体系结构主要分为感知层(感知执行层)、网络层和应用层

其中,感知层主要完成信息的采集、转换和收集;网络层主要完成信息的传递和处理;应用层主要完成数据管理和数据的处里,并将这些数据与行业相结合。

物联网的发展趋势

以应用领域为先导,紧跟技术潮流并及时适应客户需求的快速变化是物联网行业发展的重要趋势。

一方面,通信、定位、存储、AI算法等技术的进步,推动物联网产品更新迭代:

另一方面,随着消费和产业不断升级,物联网的应用领域持续扩张,逐步细化出如智能交通、智慧出行、智能支付、智能家居、智慧零售、智慧物流、智慧工业、公共服务、智慧农业等多个领域。

数字媒体

数字媒体是指采用数字化的方式,即以二进制的形式,通过计算机产生、采集、存取、处理、传播的信息媒体。

数字媒体技术是通过计算机和通信手段,综合处理文字、声音、图形、图像等信息,使抽象的信息变成可感知、可管理和可交互的一种技术。

特征:

多样性:体现在信息形式包含文字、图形、声音、图像视频和动画等多种表现形式;

集成性:既要对信息进行处理,还要将多种形式的住息有机地结合起来,对信息进行多通道获取、存储、组织与合成

交互性:用户可以更有效地控制和使用媒体,增加对媒体的注意、理解,延长信息的保留时间

实时性:声音与视频、动画图像等画面必须严格同步

数字媒体文件的类型

  1. 文本文件

  2. 图片文件

    图形文件:图形也称为矢量图。

    图像文件:静态图像也叫位图。

    图像文件的类型有:.bmp、.jpeg、.gif、.tif、.psd、.png、.pdf等。

    图像文件的参数:分辨率、图片尺寸、色彩数。

  3. 视频文件:常见的视频文件的类型有:avi、wmv、mov、mpeg、rm、flv等。

  4. 动画文件:常见的动画文件的类型有:gif和swf等。

  5. 声音文件:常见的声音文件的类型有:.wav、.mp3、.mid、.wma、.cd和.ra。

数字媒体压缩技术

数字图像的处理过程

去噪、增强、复制、分割、提取特征、压缩、存储、检索

数字声音

它具有存储方便、存储成本低廉、失真小、编辑和处理非常方便等特点

声音的数字化需要经历三个阶段:采样,量化,编码

采样是把时间上连续的模拟信号在时间轴上离散化的过程。

量化的主要工作就是将幅度上连续取值的每一个样本转换为离散值表示

编码是整个声音数字化的最后一步,其实声音模拟信号经过采样,量化之后已经变为了数字形式,但是为了方便计算机的储存和处理,我们需要对它进行编码,以减少数据量。

数字视频

数字视频特点:适合于网络应用、再现性好、便于计算机编辑处理

数字视频处理的技术过程

采样、量化、编码

虚拟现实技术

虚拟现实技术(英文名称:Virtual Reality,缩写为VR),又称虚拟实境或灵境技术,是20世纪发展起来的一项全新的实用技术。借助计算机等设备产生一个逼真的三维视觉、触觉、嗅觉等多种感官体验的虚拟世界,从而使处于虚拟世界中的人产生一种身临其境的感觉

特点:感知性、存在性、交互性、自主性

区块链

狭义来讲, 区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本。

广义来讲,区块链技术是利用块链式数据结构来验证和存储数据、利用分布式节点共识算法来生成和 更新数据、利用密码学的方式保证数据传输和访问的安全性、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式。

顾名思义,区块链(blockchain)是一种数据以区块(block)为单位产生和存储,并按照时间顺序首尾相连形成链式(chain)结构,同时通过密码学保证不可篡改、不可伪造及数据传输访问安全的去中心化分布式账本。

区块链基础技术

  • 点对点分布式技术(P2P)
  • 非对称加密技术
  • 哈希算法
  • 共识机制
  • 数字签名

区块链技术的特性

  • 去中心化(最重要最显著)
  • 共识性
  • 不可篡改性
  • 可追溯性
  • 可编程性

区块链分类

公有链:即为对所有用户开放的区块链技术,任何人都可以参与此类区块链技术构建的网络,在网络中没有权限设定,也没有身份认证。参与成员不仅可以在公有链中开展业务操作,更可以查看所有的数据,公有链中的数据是完全透明的

私有链:此类区块链技术构建的网络是完全中心化并且不对外开放。

联盟链:联盟链是介于公有链和私有链的一种区块链技术。与公有链相比,联盟链在成员加入方面设有“门槛”,在联盟链中天然植入了一套权限管理系统,联盟链成员在加入前需要经过权限系统的授权。在联盟链中有多个模块,加入的成员将根据权限系统在不同模块中使用不同功能。与公有链相比,联盟链另一大特点是没有完全去中心化,在联盟链中部分底层关键技术采用了分布式系统的概念实现,通过这类方式实现了数据的高速传输

区块链技术原理

分布式账本

分布式账本是一个在多站点﹑多机构或多国家所组成的网络上进行电子数据复制﹑共享及同步同识,其中并不存在中央管理员或集中数据存储的分布式分类账本。

分布式账本的本质

分布式:区块链数据库在潜在的不受信任的参与者之间共享,并且在网络中的所有节点上都证明是相同的。所有参与者都有相同的信息。

不可变:区块链数据库是所有交易的不可更改的历史记录,使用区块哈希可以很容易地检测和防止更改历史记录。

安全:所有更改均由已知身份签名的交易执行。这些功能与商定的共识机制一起工作,可在区块链网络的所有参与者之间提供“对抗信任”。

分布式账本的原理

分布式账本的原理是其数据库分布于对等网络的节点(设备)上,其中每个节点都复制及存储与账本完全相同的副本并独立更新。分布式账本的主要优点是不存在中央权威。当一个账本出现更新,每个节点都将执行一笔新交易,然后所有节点以共识机制投票决定哪一个副本是正确的。一旦达成共识,所有其他节点都会按照正确副本的数据进行更新。

非对称加密算法

对称加密算法在加密和解密时使用的是同一个秘钥;而非对称加密算法需要两个密钥来进行加密和解密,这两个密钥是公开密钥(public key,简称公钥)和私有密钥(private key,简称私钥)。

应用

数字签名(又称公钥数字签名)

是只有信息的发送者才能产生的别人无法伪造的一段数字串,这段数字串同时也是对信息的发送者发送信息真实性的一个有效证明。它是一种类似写在纸上的普通的物理签名,但是在使用了公钥加密领域的技术来实现的,用于鉴别数字信息的方法。一套数字签名通常定义两种互补的运算,一个用于签名,另一个用于验证。数字签名是非对称密钥加密技术与数字摘要技术的应用。

智能合约

智能合约是一套以数字形式定义的承诺(commitment),包括合约参与方可以在上面执行这些承诺的协议。

区块链的智能合约构建及执行分为如下几步:

  • 多方用户共同参与制定一份智能合约;
  • 合约通过P2P网络扩散并存入区块链;
  • 区块链构建的智能合约自动执行。

作用

在区块链中智能合约相当于现实社会的法律一般、通过合约关系很好的规范参与成员的职责和利益。

最关键的,基于智能合约的区块链可以取代目前涉及第三方中介的业务

共识机制

共识机制是区块链系统在不同节点间建立信任、达成共识、实现去中心化的核心技术。它是结合经济学、博弈论等多学科设计出来的一套保证区块链中各节点都能维护区块链系统的方法,是保持区块链安全稳定运行的核心。

共识机制基于竞争式或投票式数学原理,以共识协议实现安全的记账规则,决定了参与节点对交易数据达成一致的方式,保证了合规数据最终被全部诚实节点确认,实现了分布式账本数据记录的一致性和活性。

发展趋势

在未来,区块链技术将越发成熟和贴近人们的需求,随着区块链技术的不断普及,借助去中心化技术,人们日常生活中产生的数据通过区块链存储后将公开透明。借助区块链智能合约技术,人们的日常生活将趋于“合约化”,任何行为将根据“代码”的固定规则进行,从而使第三方的中介机构越来越少。长此以往,将实现社会交易成本降低的同时大幅提升社会效率。

典型区块链项目

案例过多,可以看一下之前的扩展模块