前言:这是由信息技术老师发的复习资料复制而来,某些格式可能会出现问题。文章内容较多,页面可能有少许卡顿,请见谅。小提示,可以使用浏览器的搜索(查找)功能(电脑请按Ctrl+F,手机/平板请在浏览器菜单中寻找)快速找到自己需要的部分。如有任何问题,请在下方评论。
必修一 数据与计算
数据、信息、知识、大数据
- 数据是对客观事物属性的描述,是记录下来的某种可以识别的符号
- 信息是数据中所包含的意义,是对数据进行加工的结果。
信息的特征:传递性、时效性、共享性、真伪性、依附性、价值相对性、可处理性
数据和信息的共同特征:普遍性、可处理性、传递性、共享性、价值性、时效性
数据和信息的不同特征:数据:载体性、孤立性、客观性 信息:依附性、联系性、主观性
- 知识是人们在改造世界的实践活动中所获得的可用于指导实践的认识、规律和经验,是归纳提炼出来的有价值的信息。
- 从数据到信息,再到知识,是一个从低级到高级的认知过程。信息是经过加工的数据,知识是经过人类归纳整理和反复验证后沉淀下来而呈现的规律。
- 大数据特征:数据量、处理速度、多样性、真实性
数据编码
编码:是指用预先规定的方法将文字、数字或其他对象转换成规定的符号组合,或将信息、 数据转换为规定的脉冲电信号。
- 数值数据:计算机中的数值数据是以补码的方式表示的
- 文本数据: 西文字符的编码(ASCII 码)、汉字的编码(兼容ASCII编码)、Unicode字符集,是全球可以共享的编码字符集
- 进制转换
二进制转十进制:
-
- 按位权展开(2进制位权为2n-i)
十进制转换成二进制数:倒叙除二反向取余法
任意进制转十进制: 按位权展开相加
十进制转n进制:倒叙除n反向取余法
-
- 图像数字化
不考虑其它因素,图像分辨率越高,采样的精度就越高,数字化后图像越清晰,但图像文件占用的存储空间也越大
未经压缩的图像的数据量(单位:B)=图像分辩率×颜色深度÷8
-
- 声音数字化
采样频率、量化位数、声道数是数字化音频的技术指标,被称为声音数字化的三要素,直接影响数字化后音频的质量及其数据量的大小。
数据量(单位:字节)=数据率×持续时间
=(采样频率×量化位数×声道数)÷8×持续时间
单位换算
1B=8b ,1MB=1024KB ,1KB=1024B,1GB=1024MB,1TB=1024GB
数据处理的一般过程
- 数据处理:是对数据采集、存储、加工、分析和表达的过程。
数 据 处 理
明确目标—数据采集—数据加工—数据分析(数据加工,分析,可视化表达)—报告撰写
明确目标:是指明数据处理的目的,确立分析思路。(通常采用5W2H分析法,即「七何分析法」)
选择合适的数据采集方法和工具:(传统方式/网络方式)
加工、分析及可视化数据:
数据加工:是指通过数据编码、数据清洗、数据重组等一 系列过程,使采集到的数据符合数据分析的需求。
数据分析:有三类,对比 细分 预测(对比分析法、平均分析法
交叉分析法)
数据可视化:数据可视化是指将数据分析的结果通过表格、图表、图 形等形式显示出来。常见图表:折线图(一段时间的变化趋势)、条形(柱形)图(比较不同项目的大小或多少)、饼图(比例)、散点图(表示两个变量之间的关系)、雷达图(多个变量在不同维度上的表现)、热力图(用颜色表示数据密度或强度)、词云图(可视化文字数据)。
数据处理的方法和工具
人工获取(调查访谈、观察实验、文献调研),自动采集(物联感知采集、视频监控采集、网络平台采集以及从数据库中采集等)
数据备份:是周期性地将数据以某种方式制作一个或多个备份,并将其存放在专门设备上加以保护,以便在数据丢失或损坏时能够有效地进行数据恢复。
个人数据备份(主要是通过文件的复制完成),企业数据备份(主要在服务器上进行数据备份)
数据隐私保护:立法、技术、管理
数据的组织和存储:数据以文件(按照数据的组织和编码方式,文件可以分为不同的类型,可以由文件的后缀名加以区分)或数据库(数据库按照特定的数据结构来组织、存储和管理数据)的形式永久存储在外存储器中。
数据存储形式:结构化数据通常存储在关系型数据库或表格文件中。关系数据库是现代信息系统最流行的一种数据存储结构。非结构化数据( unastmuietured data)主要以多媒体格式文件存储,例如各种格式的视频文件音频文件、图像文件文本文件等。
非关系型数据库(NoSQL)泛指非关系型的数据库,去掉关系数据库的关系型特性。数据之间无关系。
数据的计算
- 数值数据
求和 SUM、计数 COUNT、求平均、AVERAGE、求最大值 MAX 、 求最小值 MIN
、求平方根 SQRT、求余数 MOD
- 文本数据
求字符串的长 LEN
求子串的 LEFT(从左边截取字符串) RIGHT(从右边截取字符串) MID(截取指定子串)
查找字符串 FIND
删除空格 TRIM
- 日期时间数据
返回当天日期 TODAY
返回当前日期和时间 NOW
返回两日期间相差的实足年数、月数、天数 DATEDIF
- 逻辑数据(TURE、FALSE。没有运算,但关系运算和逻辑函数都会产生逻辑数据)
常用函数:IF 函数 如果满足条件返回不同的结果。可支持多个条件判断。
- 数据的排序:升序 降序(表格中针对标准单元格),(数据—筛选)
- 数据的筛选:当要从表格中找出满足一定条件的几行或几列数据时,就需要用到数据筛选功能。(数据—筛选)
- 数据的分类汇总(先分类,后汇总,1:数据—排序,2:数据—分类汇总)
- 交叉分类汇总(数据透视表,不需要先排序,直接在插入数据透视表,数据—数据透视表)
算法
- 核心概念:在有限的步骤内解决某一个问题所使用的方法。
算法的五个特征:有穷性、确定性、有零个或多个输入、可行性有一个或多个输出。
算法的(评价)好坏主要考虑以下几个指标:正确性、可读性、高效性
算法的描述:自然语言描述、伪代码描述、流程图描述
算法基本控制结构:顺序结构+选择结构+循环结构
程序:一组操作指令或语句序列,是计算机执行算法的一系列操作步骤。
程序设计语言:人们编制程序所使用的计算机语言。
程序设计的一般过程
1.分析问题 2.设计算法 3.编写程序 4.运行调试
程序设计语言
Python: 是一种解释型语言、交互式语言、面向对象语言
两种编程环境(交互式+文件式)
Python 基础知识:
- Print(“字符串”)或 Print(‘字符串’) ,如:print(“你好”)或print(‘23’)
- Print(数字) 如:Print(25)
- )Print(表达式) 如:Print(25+12+45)
- “格式控制串 ” %(占位符或者值序列),%d 输出整数,%f 输出浮点数
如:print(“%0.2f”%c)
- 如果需要输出多个内容,用逗号,隔开,Print(内容1,内容2,内容3)
如:Print(“加法运算1+2=”,1+2)
变量的命名(区分大小写)
- 由字母(A-Z,a-z),数字(0-9)、下划线(_)组成
- 第一个字符需是字母或者下划线,不能以数字开头。
- 不能使用Python中的关键字(保留字)
input()的一般格式:<变量>=input(“提示信息”)
功能:不论用户输入的什么类型的数据,input()函数的返回结果都是字符串
循环结构:
选择结构
条件表达式
一般情况:(运算符优先级顺序)
算术运算符()>关系运算符>逻辑运算符>赋值运算符(=)>逗号(,)
批量数据的含义:一组数据类型相同的数据对象。表示方法:列表
列表格式: 列表名=[数据1,数据2,数据3,数据4,数据5,数据6…….]
注意:各数据项之间用逗号分隔。
列表的访问:各项数据按顺序排列,并允许按下标访问。
下标通常从0开始,n-1结束。比如:hobby[0]表示列表中第一个数据项“篮球”,
模块化设计的思想:“自顶向下、逐步求精”
一个程序的算法设计可以从三个基本步骤——“输入”“处理”“输出”开始,形成顶层模块,再对每一个模块继续向下细化,直至每一个模块都相对独立地完成一个基本功能。
枚举法的基本原理:
是根据已知条件,在给定的范围内对所有可能的答案按某种顺序进行逐一枚举和检验,从中找出那些符合要求的答案
人工智能:是利用计算机或者计算机控制的机器,模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
从技术角度,通常把人工智能的主要发展阶段分为:运算智能、感知智能和认知智能。
机器学习:是人工智能的核心研究领域之一,它研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,从而不断改善自身的性能。
必修二 信息系统与社会
信息技术:是指在信息的获取、整理、加工、存储、传递和利用过程中所采用的技术和方法。
信息社会: 指通过创造、分配、使用、整合和处理信息进行社会经济、政治、文化活动的社会形态。本质上是以信息活动为基础的社会。
信息社会发展阶段:准备阶段(起步期、转型期)和发展阶段(初级阶段、中级阶段、高级阶段)
信息社会的特征:网络社会、数字生活、在线政府、信息经济
信息技术发展趋势:
- 网络互联的移动化和泛在化
- 信息处理的集中化和大数据化
- 信息服务的智能化和个性化
数字公民教育九大要素:数字商务、数字素养、数字访问、数字礼仪、数字权责、数字交流、数字健康、数字安保、数字法律
信息系统:由人员、硬件、软件、数据和网络构成的人机交互系统,主要用于信息的输入、存储、处理和输出。
信息系统功能:信息系统的基本功能是进行信息处理,为用户提供有用的信息。具体包括输入、存储、处理、输出和控制。
硬件
计算机:是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。
组成:运算器+控制器=cpu、存储器、输入设备和输出设备五个部分
CPU性能指标:核心数、时钟频率、字长、缓存容量
- 只读存储器ROM:只读存储器是永久性存储,通常用来存储计算机的基本信息。
- 随机存储器RAM:是用来存储正在执行中的程序和数据,是临时存储。
- 主存储器(内存):安装在计算机内部,被制成具有多个内存芯片的内存条。
- 辅助存储器(外存):由存储设备和存储介质两部分组成。
- 高速缓存:是一种存取速度,比内存更快的存储器,中央处理器到内存读取数据时,会将一整个区块的连续数据复制到高速缓存。
- 寄存器:中央处理器内部存放数据的小型存储区域,主要用来存放参与运算的数据和运算结果等。
软件
应用软件:是为了某种特定的用途而开发的软件。
系统软件:是控制和管理计算机及外部设备,支持应用软件开发和运行的相关程序集合。
软件的开发过程:
- 需求分析。主要明确功能需求、 性能需求、环境需求(软硬件环境)、 界面需求(人机交互方式)
系统设计。系统设计分为总体设计和详细设计。
- 编码。使用集成开发环境进行编程实现。
- 软件测试。可分为单元测试和系统测试等。包括黑盒测试白盒测试和负载测试等。
- 投放使用。投放使用后须记录软件投放使用的时间、更选的频率以及投放使用结果,在此基础上提出修改意见,对软件进行修改。
服务器:从硬件角度看,服务器是专门给网络中其他计算机或设备提供一种或多种服务的高性能计算机。
网络
网络是利用通信设备和线路,将地理上分散分布的具有独立功能的多台计算机或移动终端相互连接,以功能完善的网络软件实现网络中资源共享和信息传递的系统。
网络的分类:个域网、局域网(、城域网和广域网。
网络设备:网络终端设备和网络通信设备。
网络通信设备:网卡、调制解调器、路由器、交换机、无线AP等。
有线连接:涌过网线传输数据,有高的带宽和较好的抗干扰性。
无线连接:可实现通过无线电波将数据从一个设备传输到另一个设备。4G、蓝牙、Wi-Fi、RFID 等。
IP地址:指互联网协议地址,是用来识别网络设备的一串数字。
每一类地址的第一个数字的范围:
A类:1-126 B类:128-191 C类:192-223
子网掩码:与IP地址计算后,得到该IP地址的网络地址.
A类:255.0.0.0 B类:255.255.0.0 C类:255.255.255.0
网关: 网关又称网间连接器、协议转换。对于小型局域网来说,路由器就是网关
域名系统:dns用于域名和IP地址相互映射的一个分布式数据库。
物联网:指物和物相连的互联网络。
物联网通常可以分为四层架构:感知层—传输层—数据处理层—应用服务层。
传感器:主要由敏感元件和转换元件组成。
常见分类:位置传感器、接近和运动传感器、惯性传感器、压力敏和力敏传感器、光敏传感器、介质传感器、温度传感器等
物联网通信技术:蜂窝移动通信系统(如4G、5G)、近距离无线通信技术(如Wi-Fi、蓝牙、ZigBee、Z-Wave、RFID、NFC)等。
合理合法使用信息系统
社交网络平台的功能:通信功能、分享信息、网上学习、网上娱乐、电子商务等。
数字足迹:是人们在使用信息技术时留下的信息痕迹,包括所处的位置、IP地址、网页浏览记录、在搜索引擎中搜索的信息等。
信息安全法律法规:
2016年国家出台了《中华人民共和国网络安全法》
2021年11月1日,我国开始施行《中华人民共和国个人信息保护法》。
《计算机信息网络国际联网安全保护管理办法》《涉及国家秘密的通信、办公自动化和计算机信息系统审批暂行办法》《计算机信息系统国际联网保密管理规定》《信息安全等级保护管理办法》
信息系统存在的安全风险:硬件风险、软件风险、数据风险、网络风险(未授权访问+网络攻击),网络攻击(恶意软件、僵尸网络、拒绝服务攻击、后门和欺骗等)
降低信息系统的安全风险主要有两大类措施:一种是技术防范,一种是人为防范。
技术防范措施主要包括:设置防火墙、数据加密p115、病毒监控与防范等。
规范的信息系统操作习惯:不偷盗、借用、损坏信息系统设备;不随意更改、删除数据;不使用未经查毒的硬盘;不随意使用公共免费Wi-Fi进行购物、银行转账;不打开来历不明的网站;不随意下载;系统定期杀毒和升级;定期进行数据备份等。