存储
| 存储 | |
|---|---|
| 中文名 | 存储 |
| 英文名 | Storage |
| 所属领域 | 信息技术、数据管理 |
| 主要形式 | 内存、硬盘、光盘、云存储等 |
| 介质类型 | 半导体、磁性、光学、生物分子等 |
存储(英文:Storage),广义上指将信息、数据或物品以特定方式保存在某种载体或介质中以便后续识别、定位和检索的活动或技术[1]。在信息技术领域,存储特指计算机系统中用于存放程序和数据的一系列设备、介质、控制部件及管理算法所构成的系统[2]。存储、计算和传输共同构成信息技术的三大基本要素。
从微观层面看,存储指硬盘、内存、半导体芯片等具体的数据记录装置;从宏观层面看,所有物品和信息的保管保存均可纳入存储的范畴[3]。历史上,每当存储技术出现划时代的革新,其后往往伴随一个较长的社会进步与繁荣周期[4]。
人类对信息存储的探索可以追溯到远古时期。早期人类通过结绳记事、龟甲兽骨以及后来的泥板、竹简和羊皮卷等载体记录信息[5]。中国古代使用竹简记录文字,后逐渐被纸张取代;宋代毕昇发明的活字印刷术则极大推动了信息的复制与传播[5]。
近代存储技术的开端可追溯至1725年,法国人Basile Bouchon发明了打孔纸带,最初用于保存印染布上的图案[6]。1920年代,德国发明了磁带,最初用于记录声音[7]。磁带于1951年随着UNIVAC 1计算机的发明进入数据存储领域,次年IBM开始发售磁带机——726磁带单元[7]。磁鼓存储器最初于1932年在奥地利被创造出来,在二十世纪五六十年代被广泛使用,通常用作计算机内存,容量约10KB[5]。
现代计算机存储系统的发展以IBM 350 Disk File为重要里程碑。1956年,IBM制造出第一块硬盘驱动器,其中包含50张24英寸盘片,总容量不到5MB[5]。1980年IBM 3380硬盘的容量首次突破1GB,达到2.52GB[5]。1971年IBM引入了软盘,从二十世纪70年代中期到90年代末期被广泛使用,先后经历了8英寸、5.25英寸和3.5英寸等规格[5]。
存储系统可根据多种维度进行分类。基于与CPU的物理距离和访问速度,计算机存储系统呈现明显的金字塔结构,自上而下可分为寄存器、高速缓存、主存、辅助存储和离线存储等多级层次[8][9]。
基于数据持久性,存储器分为两类:
- 易失性存储器(Volatile Memory):断电后数据会丢失,如动态随机存取存储器(DRAM)和静态随机存取存储器(SRAM)。
- 非易失性存储器(Non-Volatile Memory, NVM):断电后数据不会丢失,如硬盘(HDD)、固态硬盘(SSD)、闪存(Flash)以及各类只读存储器(ROM)[10]。
基于介质类型,存储器可划分为三大类:
- 半导体存储器:包括RAM、ROM、闪存等,读写速度快,存储密度高[11],是构成主存和缓存的主要材料。
- 磁性存储器:通过磁化方向存储数据,如硬盘(HDD)、磁带等,具有非易失性和大容量特点。
- 光学存储器:通过激光束读写数据,如CD、DVD、蓝光光盘等,适用于长期归档[12]。
随机存取存储器(Random Access Memory, RAM)是一种可随机读写的半导体存储器,断电后数据即丢失。RAM主要分为两种[13]:
- 静态随机存取存储器(SRAM):利用双稳态触发器保存信息,速度快且无需刷新,但成本高、集成度低,常用于CPU高速缓存。
- 动态随机存取存储器(DRAM):利用电容存储电荷,需要周期性刷新以维持数据,成本较低、集成度高,是计算机内存的主流方案。
只读存储器(Read-Only Memory, ROM)在系统停止供电时仍能保持数据,按可编程特性分为PROM(可编程ROM)、EPROM(可擦除可编程ROM)和EEPROM(电可擦除可编程ROM)等多种类型[13]。闪存(Flash Memory)作为EEPROM的发展形态,具有非易失性和快速读取能力,广泛应用于固态硬盘(SSD)和移动设备中[13]。
除传统闪存外,多种新型非易失性存储器正在快速发展,主要包括:
- 相变存储器(PCM/PRAM):利用硫系化合物在晶态和非晶态之间的可逆相变实现数据存储[14]。
- 阻变存储器(RRAM/ReRAM):基于外加电场作用下介电材料的电阻在高阻态和低阻态之间的可逆转换[14]。
- 磁阻随机存取存储器(MRAM):利用磁性状态而非电荷存储数据,同时具有SRAM的速度和非易失性优点,写入耐久性极高(可达10^15次以上)[14]。
2015年,英特尔与镁光公司联合发布了3D XPoint存储技术,是迄今最接近商用的字节寻址非易失性存储器之一[10]。
存储层次(Memory Hierarchy)是计算机体系结构中通过多级存储器组合解决容量、速度与成本矛盾的层次化存储系统[9]。典型的存储层次从上到下包含:CPU寄存器(纳秒级访问)、SRAM高速缓存(0.5–2.5纳秒)、DRAM主存(50–70纳秒)以及基于磁盘或SSD的辅助存储(毫秒级访问)[9]。这一层次结构基于程序执行的局部性原理,通过高速缓存预取相邻数据来提升整体访问效率[9]。
- 直连式存储(Direct Attached Storage, DAS):存储设备直接连接到服务器,结构简单但扩展性受限[15]。
- 网络附加存储(Network Attached Storage, NAS):基于TCP/IP协议实现数据共享,采用文件级访问方式,支持Windows、Linux、macOS等多种操作系统[15]。
- 存储区域网络(Storage Area Network, SAN):通过光纤通道(Fibre Channel)或以太网技术构建独立的高速存储网络,以块级方式提供数据访问,高性能和高可用性使其广泛应用于企业数据中心[16]。
分布式存储将数据分散存储于多台物理设备上,通过网络通信协同提供高吞吐量和高可扩展性的存储服务。对象存储(Object Storage)是一种重要的分布式存储形态,它将数据封装为“对象”存储在扁平地址空间的存储池中,结合了NAS的文件共享能力和SAN的高速访问特征[17]。
云存储是在分布式存储技术基础上发展而来的商业化服务模式。2006年亚马逊推出的Amazon Simple Storage Service(Amazon S3)开启了云计算时代的主流对象存储服务,此后Microsoft Azure、Google Cloud Platform等云服务商相继推出各自的存储产品[18][19][20]。云存储通常提供分层存储选项(如标准存储、低频存储、归档存储),兼顾数据访问性能与长期保存成本[21]。
DNA存储技术是一种利用人工合成脱氧核糖核酸(DNA)存储数字信息的新兴技术。其核心原理是将二进制数据映射为DNA碱基序列(A、T、C、G组合),通过人工合成DNA链实现数据写入,借助DNA测序进行数据读取[22]。DNA存储具有极高的存储密度——理论上约10kg的DNA即可存储当前全球一年的数据总量,同时半衰期超过500年,适用于档案冷存储等长期保存场景[22]。该技术于2019年入选《时代周刊》年度最佳发明榜单[23]。
全闪存存储采用固态硬盘(SSD)作为主存储介质,通过高密度容量和高效IO调度算法大幅提升存储系统的读写性能[1]。在人工智能、高性能计算等数据密集型应用场景的推动下,分布式存储系统开始集成元数据加速、缓存预取和多协议统一访问等智能特性[1]。
存储技术正朝着更大容量、更高速度、更低功耗和更安全的方向演进。未来的主要趋势包括:
- 存储与计算的深度融合,存算一体化架构应对“存储墙”瓶颈[9]。
- 非易失性存储器在内存层次的渗透,推动持久性内存技术走向标准化部署。
- 云原生和边缘计算催生对多云混合存储架构的需求[1]。
- DNA存储、玻璃光盘等下一代介质推动超高密度和超长期数据保存的实现。
与此同时,存储技术也面临诸多挑战:海量数据存储带来的能耗问题、介质可靠性和数据长期完整性保障、跨地域分布式存储的一致性管理以及新兴应用(如AI大模型)对极高吞吐和极低延迟的存储需求等。
- ↑ 1.0 1.1 1.2 1.3 信息存储
- ↑ 存储系统
- ↑ 存储技术的前世今生:从打孔卡到硬盘,信息技术爆炸式发展
- ↑ 谢长生:存储技术发展历程
- ↑ 5.0 5.1 5.2 5.3 5.4 5.5 第 1 章 混沌初开——存储系统的前世今生
- ↑ 中国科学院软件研究所科普文章
- ↑ 7.0 7.1 IT史上改变历史的十大存储发明
- ↑ 系统存储架构全解析:从分类到实践的深度指南
- ↑ 9.0 9.1 9.2 9.3 9.4 存储层次
- ↑ 10.0 10.1 非易失性存储器技术
- ↑ 半导体存储器——ROHM
- ↑ 光存储
- ↑ 13.0 13.1 13.2 RAM、SRAM、SDRAM、ROM、EPROM、EEPROM、Flash存储器概念
- ↑ 14.0 14.1 14.2 MCU三大新型存储器技术梳理
- ↑ 15.0 15.1 NAS 和 SAN 服务器概述
- ↑ IT知识百科:什么是SAN和NAS?两者有啥区别?
- ↑ 对象存储
- ↑ Amazon S3
- ↑ Azure 存储
- ↑ Google Cloud Storage
- ↑ 对象存储 COS
- ↑ 22.0 22.1 DNA存储技术
- ↑ DNA数据存储器