使用固态硬盘管理主存KV数据库的虚拟内存

来源：五一七教育网

ＩＳＳＮ　ｌ６７３—９４１ｇ　ＣＯＤＥＮ　ＪＫＹＴＡ８　Ｅ—ｍａｉｌ：ｆｅｓｔ＠ｖｉｐ．１６３．ｃｏｍ　Ｊｏｕｒｎａｌ　ｏｆ　Ｆｒｏｎｔｉｅｒｓ　ｏｆＣｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ　ｈｔｔｏ：／／ｗｗｗ．ｃｅａｊ．ｏｒｇ　Ｔｅｌ：＋８６．．１０．．５１６１６０５６　１６７３－－９４１８／２０１　１／０５（０８）．－０６８６－－０９　ＤＯＩ：１０．３７７８￣．ｉｓｓｎ．１６７３—９４１８．２０１１．０８．００２　使用固态硬盘管理主存ＫＶ数据库的虚拟内存术　韩旭　，曹巍，孟小峰　中国人民大学信息学院，北京１００８７２　ＶｉｒｔｕａｌＭｅｍｏｒｙＭａｎａｇｅｍｅｎｔｆｏｒＭａｉｎ．Ｍｅｍｏｒｙ　ＫＶＤａｔａｂａｓｅＵｓｉｎｇＳｏｌｉｄＳｔａｔｅＤｉｓｋ　ＨＡＮ　Ｘｕ　，ＣＡＯ　Ｗｅｉ，ＭＥＮＧ　Ｘｉａｏｆｅｎｇ　Ｓｃｈｏｏｌ　ｏｆ　Ｉｎｆｏｒｍａｔｉｏｎ，Ｒｅｎｍｉｎ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｃｈｉｎａ，Ｂｅｉｊｉｎｇ　１　００８７２，Ｃｈｉｎａ　＋Ｃｏｒｒｅｓｐｏｎｄｉｎｇ　ａｕｔｈｏｒ：Ｅ—ｍａｉｌ：ｈａｎｘｕｍｅｌｏｄｙ＠ｒｕｃ．ｅｄｕ．ｃｎ　Ｉ－ＩＡＮ　Ｘｕ，ＣＡＯ　Ｗｅｉ，ＭＥＮＧ　Ｘｉａｏｆｅｎｇ．Ｖｉｒｔｕａｌ　ｍｅｍｏｒｙ　ｍａｎａｇｅｍｅｎｔ　ｆｏｒ　ｍａｉｎ－ｍｅｍｏｒｙ　ＫＶ　ｄａｔａｂａｓｅ　ｅｓｍｇ　ｓｏｌｉｄ　ｓｔａｔｅ　ｄｉｓｋ．Ｊｏｕｒｎ￣ｏｆ　Ｆｒｏｎｔｉｅｒｓ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ，２０１１，５（８）：６８６－６９４．　Ａｂｓｔｒａｃｔ：Ｋｅｙ—ｖａｌｕｅ　ｉｎ—ｍｅｍｏｒｙ　ｄａｔａｂａｓｅｓ　ｈａｖｅ　ｔｈｅ　ｃｈａｒａｃｔｅｒｉｓｔｉｃｓ　ｏｆ　ｅｆｉｆｃｉｅｎｃｙ，ｕｓａｂｉｌｉｔｙ　ａｎｄ　ｓｃａｌａｂｉｌｉｔｙ．Ｂｅｃａｕｓｅ　ｏｆ　ｈｔｅ　ｌｉｍｉｔｓ　ｏｆ　ｈｔｅ　ｃａｐａｃｉｔｙ　ｏｆ　ｍａｉｎ　ｍｅｍｏｒｙ，ｔｈｅ　ａｐｐｌｉｃａｔｉｏｎｓ　ｄｅａｌｉｎｇ　ｗｉｔｈ　ｌａｒｇｅ　ａｍｏｕｎｔ　ｏｆ　ｄａｔａ　ｈａｖｅ　ｔｏ　ｓｗａｐ　ｄａｔａ　ｂｅｔｗｅｅｎ　ｍａｉｎ　ｍｅｍｏｒｙ　ａｎｄ　ｄｉｓｋｓ．Ｗｈｉｌｅ　ｓｏｌｉｄ　ｓｔａｔｅ　ｄｉｓｋｓ（ＳＳＤｓ）ｈａｖｅ　ｔｈｅ　ｈｉｌｇｈ　ｐｅｒｆｏｒｍａｎｃｅ　ｏｆ　ｒａｎｄｏｍ　ｒｅａｄｓ　ａｓ　ａ　ｎｅｗ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ，ｍｅｙ　ｃａｎ　ｓｐｅｅｄ　ｕｐ　ｒａｎｄｏｍ　ｒｅａｄｓ　ｏｎ　ｖｉｒｔｕａｌ　ｍｅｍｏｒｙ．Ｔｏ　ｒｅｍｅｄｙ　ｔｈｅ　ｌｏｗｅｒ　ｐｅｒｆｏｒｍａｎｃｅ　ｏｆ　ｒａｎｄｏｍ　ｗｒｉｔｅｓ　ｏｎ　ＳＳＤｓ，ｔｈｉｓ　ｐａｐｅｒ　ｐｒｏｐｏｓｅｓ　ａｎ　ｏｐｔｉｍｉｚａｔｉｏｎ　ｍｅｔｈｏｄ　ｏｆ　ｗｒｉｔｅ　ｂｕｆｆｅｒ　ｏｆ　ＳＳＤ，ｗｈｉｃｈ　ｔｒａｎｓｆｏｒｍｓ　ｓｅｖｅｒａｌ　ｒａｎｄｏｍ　ｗｒｉｔｅｓ　ｔｏ　ａ　ｓｅｑｕｅｎｔｉａｌ　ｗｒｉｔｅ，ａｎｄ　ｄｅｓｉｇｎｓ　ａ　ｇａｒｂａｇｅ　ｃｏＨｅｃｔｉｏｎ　ｐｏＳｃｙ　ｏｆ　ＳＳＤ，ｗｈｉｃｈ　ｔｒａｎｓｆｏｒｍｓ　ｓｅｖｅｒａｌ　ｒａｎｄｏｍ　ｗｒｉｔｅｓ　ｔｏ　ａ　ｓｅｑｕｅｎｔｉｌａ　ｒｅａｄ　ａｎｄ　ａ　ｓｅｑｕｅｎｔｉｌａ　ｗｒｉｔｅ．ｔｏ　ｉｍｐｒｏｖｅ　ｈｔｅ　ｓｐａｔｉａｌ　ｕｔｉｌｉｚａｔｉｏｎ　ｏｆｋｅｙ－ｖａｌｕｅ　ｉｎ－ｍｅｍｏｒｙ　ｄａｔａｂａｓｅ．Ｆｉｎａｌｌｙ，ａｎ　ＳＳＤ・・ｂａｓｅｄ　ｖｉｒｔｕａｌ　ｍｅｍｏｒｙ　ｉｍｐｌｅｍｅｎｔａｔｉｏｎ　ｉｓ　ｐｒｏｐｏｓｅｄ　ｔｏ　ｒｅａｌｉｚｅ　ｈｉｇｈ　ｐｅｒｆｏｒｍａｎｃｅ　ｏｆ　ｋｅｙ・・ｖａｌｕｅ　ｍａｉｎ　ｍｅｍｏｒｙ　ｄａｔａ－　ｂａｓｅｓ，ａｎｄｔｈｅｉｍｐｒｏｖｅｍｅｎｔ　ｗｈｉｃｈ　ｉｓ　ａｔ　ｍｏｓｔ　４０％，ｉｓ　ｃｏｎｆｉｒｍｅｄ　ｂｙ　ｃｈａｎｇｉｎｇ　ｈｔｅ　ｓｏｕｒｃｅ　ｃｏｄｅ　ｏｆＲｅｄｉｓ　ｎｉ　ｅｘｐｅｒｉｍｅｎｔ．　Ｋｅｙ　ｗｏｒｄｓ：ｋｅｙ—ｖａｌｕｅ；ｓｏｌｉｄ　ｓｔａｔｅ　ｄｉｓｋ（ＳＳＤ）；ｖｉｒｔｕａｌ　ｍｅｍｏｒｙ；ｂｕｆｆｅｒ　摘要：主存￣４Ｊ［（ｋｅｙ—ｖａｌｕｅ，ＫＶ）数据库具有高效性、易用性和可扩展性。由于主存容量有限，一些数据量　较大的应用必须使用磁盘进行数据交换。而固态硬盘（ｓｏｌｉｄ　ｓｔａｔｅ　ｄｉｓｋ，ＳＳＤ）有高速的随机读特点，使用固态　＊Ｔｈｅ　Ｎａｔｉｏｎａｌ　Ｎａｔｕｒａｌ　Ｓｃｉｅｎｃｅ　Ｆｏｕｎｄａｔｉｏｎ　ｏｆ　Ｃｈｉｎａ　ｕｎｄｅｒ　Ｇｒｎａｔ　Ｎｏ．６０８３３００５，９１０２４０３２，６１０７００５５（国家自然科学基金）；ｔｈｅ　Ｎａｄｏｎａｉ　Ｓｃｉｅｎｃｅ　ｎａｄ　Ｔｅｃｈｎｏｌｏｇｙ　Ｍａｊｏｒ　Ｓｐｅｃｉａｌ　Ｐｒｏｊｅｃｔｓ　ｏｆ　Ｃｈｉｎａ　ｕｎｄｅｒ　Ｇｒａｎｔ　Ｎｏ．２０１０ＺＸ０１０４２—００２－００３（国家科技重大专项　“核高基”项目）；ｔｈｅ　Ｒｅｓｅａｒｃｈ　Ｆｕｎｄｓ　ｏｆ　Ｒｅｎｍｉｎ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｃｈｉｎａ　ｕｎｄｅｒ　Ｇｒｎａｔ　Ｎｏ．１０ＸＮ１０１８（中国人民大学科学研究基金）．　Ｒｅｃｅｉｖｅｄ　２０１１—０４，Ａｃｃｅｐｔｅｄ　２０１１－０６．　韩旭等：使用固态硬盘管理主存ＫＶ数据库的虚拟内存　６８７　硬盘作为主存ＫＶ数据库的虚拟内存会提高对不在主存中的数据的读性能。但是固态硬盘的随机写性能较　差，于是提出了针对固态硬盘的写缓冲区优化算法，将多个随机写转化为一个连续写，并设计了固态硬盘　虚拟内存的垃圾回收机制，将多个随机写转化为一个连续读和一个连续写，从而提高主存ＫＶ数据库的性　能。通过改写源代码，将该虚拟内存管理应用于Ｒｅｄｉｓ中，并进行了实验测试，结果表明该虚拟内存管理的　性能比原有性能最大提升了４０％。　关键词：键值；固态硬盘；虚拟内存；缓冲区　文献标识码：Ａ　中图分类号：ＴＰ３９１　１　引言　在过去的３０年里，由Ｃｏｄｄ提出的关系数据库　模型…在数据库应用领域发挥了重要作用，这种模　式提供了简单性、健壮性与灵活性，将大批量的数　据组织成人们易于理解的表的形式。这种以表的方　式组织数据的模式使数据库领域产生了很大变革，　使数据库应用更加广泛，也使关系型数据库管理系　统（ｒｅｌａｔｉｏｎａｌ　ｄａｔａｂａｓｅ　ｍａｎａｇｅｍｅｎｔ　ｓｙｓｔｅｍ，ＲＤＢＭＳ）　逐渐成为一种通用型数据库系统。　尽管关系型数据库能够提供例如简单性、健壮　性和灵活性等特点，但是其在某一个特定领域的性　能，不一定优于专门为这种领域而设计的替代　方案。随着Ｗｅｂ　２．０技术的发展，面对用户数量的　不断增长和海量的数据存储和数据请求，关系数据　库的伸缩性能就成为其众多优点下的阿克琉斯之　踵。对于短时间内数据量的猛增，只升级服务器的　硬件性能显然对整个系统处理能力的提升是有限　的，当硬件的提升达到上限时，那么整个系统的性　能提升也就达到了上限，这时对数据库的水平扩展　就成为整个系统提升性能的唯一通路。但是由于关　系数据库是以关系表的形式存储数据，对于数据库　的水平扩展就要涉及表的一系列复杂的拆分，尤其　是当试图扩展的节点成百上千时，关系数据库水平　扩展的复杂性将会使整个工作变得繁重不堪。　键值（ｋｅｙ—ｖａｌｕｅ，ＫＶ）数据库的提出恰好能解决　伸缩性的问题。ＫＶ数据库通过一个ｋｅｙ对应一个　ｖａｌｕｅ这种映射来存储数据，这使得ＫＶ数据库更适　合非结构化的数据，用户可以自己来定义ｖａｌｕｅ存　储数据的语义信息，因此ＫＶ数据库有着极高的易　用性，并且非常容易对系统进行扩展。同时，由于　数据访问是通过ｋｅｙ和ｖａｌｕｅ的映射实现的，可以对　这种数据访问路径进行更多的优化，使ＫＶ数据库　达到很高的性能。　Ｔａｂｌｅ　１　Ｃｏｍｐａｒｉｓｏｎ　ｂｅｔｗｅｅｎ　ＲＤＢＭＳ　ａｎｄ　ＫＶ　ｄａｔａｂａｓｅｓ　表１　ＲＤＢＭＳ和ＫＶ数据库对比　关系数据库　ＫＶ数据库　使用ＳＱＬ语句对数据进　使用系统提供的应用程序接口　行操作。ＳＱＬ语句可以（ａｐｐｌｉｃａｔｉｏｎ　ｐｒｏｇｒａｍ　ｉｎｔｅｒｆａｃｅ，　提供聚集、排序等强大　ＡＰＩ）对数据进行操作。使系统免　的操作，但增加了系统　却了解析复杂ＳＱＬ语句的负担，　的　相　可以根据应用程序数据类型而　设计存储形式，减少类似于　ＳＱＬ中的表连接、聚集操作　数据以表的形式进行存　数据可以根据不同的应用以对　储，因此需要在应用程　象的形式进行存储，省却了中　序与数据库之间建立一　问的映射层，使得代码变得高　个对象到关系的映射　效兼容　存储的数据中包含了数　数据的逻辑关系需要在应用程　据间的逻辑关系　序中体现　由于这种简单的映射关系，ＫＶ数据库具有与　生俱来的伸缩性，可以支持动态的扩充。这种数据　库提供了相对廉价的设计存储平台，可以拥有庞大　的扩充潜力。当用户数量和数据量猛增时，供应商　只需要扩展平台，系统的存储能力就能获得较大的　提升。因此ＫＶ数据库也是云计算的最佳搭档，像　Ｃａｓｓａｎｄｒａ、Ｈｂａｓｅ这样的云计算数据库也是基于ＫＶ　存储结构　６８８　Ｊｏｕｒｎａｌ　ｏｆＦｒｏｎｔｉｅｒｓ　ｏｆＣｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ计算机科学与探索　２０１１，５（８）　不同于面向云计算的ＫＶ数据库，基于主存的　ＫＶ数据库则针对的是具有高速响应、低延时的数　据应用。主存ＫＶ数据库将数据全部放在主存中，对　数据的读取、赋值和删除操作全部在主存中执行，　因此主存ＫＶ数据库有着极高的响应性能。针对一　些数据实时统计的应用和对服务器端数据进行缓　速度。Ｍｅｍｃａｃｈｅｄ将应用程序对数据库的查询和一　些ＡＰＩ调用得到数据进行缓存，当下次应用程序需　要访问这些数据时，如果数据在Ｍｅｍｃａｃｈｅｄ中命中，　则直接从主存中读取这些数据并提供给应用程序，　省却了应用程序再对数据库进行查询的操作。通过　这种方式，Ｍｅｍｃａｃｈｅｄ可以降低数据库的负载，并　加速应用程序的处理速度。但是Ｍｅｍｃａｃｈｅｄ只是用　存的需求，主存ＫＶ数据库能够快速处理这些响应　时间要求很低的请求。但是由于主存数据存储容量　的，当超过一定数据量时，主存存放不下数据　而造成数据丢失。因此当前对主存ＫＶ数据库的大　部分应用是使用主存ＫＶ数据库（如：Ｍｅｍｃａｃｈｅｄ）做　缓存，使用传统关系型数据库（如：ＭｙＳＱＬ）存储数　据。有的主存ＫＶ数据库实现了虚拟内存的功能，通　过将冷数据交换到在磁盘中开辟的虚拟内存空间，　实现数据容量的扩充。但是由于在磁盘存放数据降　低了主存ＫＶ数据库的读写性能，该方法并没有得　到广泛采用。　本文针对主存ＫＶ数据库的虚拟内存读写性能　低下的问题，提出了使用固态硬盘（ｓｏｌｉｄ　ｓｔａｔｅ　ｄｉｓｋ，　ＳＳＤ）作为虚拟内存；存放主存数据库中的冷数据；　针对ＳＳＤ的读写特点，将多个随机写转化成一个连　续写的写缓冲区：设计了一种垃圾回收机制，在保　持虚拟内存高效的读写性能的同时，处理虚拟内存　的空闲空间回收，从而在扩充了数据库存储容量的　同时，保持了整个数据库的高性能。　文章组织结构如下：第２章介绍ＫＶ存储和固　态硬盘方面的相关工作；第３章介绍基于固态硬盘　将多个随机写转化为一个连续写的写缓冲区的设　计方案；第４章介绍针对简单的追加写方式提出的　垃圾回收机制；第５章对本文进行总结。　２相关工作　随着Ｗｅｂ应用的广泛普及，每天都会有大量的　数据需要网络服务提哄商来处理，对ＫＶ数据库这　种高扩展性的应用需求使得大量的ＫＶ数据库应运　而生。下面简单列述几种ＫＶ数据库：　Ｍｅｍｃａｃｈｅｄ［２］是一个高性能的分布式主存数据　库，它将数据全部存放在主存中以提供极高的处理　以缓存系统中较热的数据，并没有提供数据持久化　等功能，因此Ｍｅｍｃａｃｈｅｄ并不能完全替代数据库，　只是作为系统中对数据库数据的缓存。　Ｒｅｄｉｓｐ　也是一个高性能的分布式主存数据库，　它同Ｍｅｍｃａｃｈｅｄ类似，同样能够作为系统中对数据　库数据的缓存来使用，以达到加速应用程序处理速　度的目的。同时，Ｒｅｄｉｓ还提供了虚拟内存和数据持　久化的功能。正因为如此Ｒｅｄｉｓ存储的数据容量可　以不受内存容量的，通过将冷数据写到磁盘中　进行存储，以达到扩充存储数据容量的目的。而数　据持久化功能可以使Ｒｅｄｉｓ中存储的数据定期写到　磁盘中，从而实现了数据库对于数据的持久化存储，　在系统出现问题时可以恢复大量的数据。在一些测　试中，Ｒｅｄｉｓ的性能要优于Ｍｅｍｃａｃｈｅｄ。　ＢｅｒｋｅｌｅｙＤＢ（ＢＤＢ）［４］是一个高性能的嵌入式ＫＶ　数据库，并提供一组很简洁的ＡＰＩ接口。ＢｅｒｋｅｌｅｙＤＢ　虽然结构简单，但是它也提供了很多高级数据库的　特性，例如ＡＣＩＤ特性（即原子性、一致性、隔离性　和持久性）、事务处理、锁系统等。ＢｅｒｋｅｌｅｙＤＢ在　嵌入式环境中比关系型数据库要好，这是由于在嵌　人式环境中数据库程序同应用程序在相同的地址　空间中运行，数据库操作不需要进程间的通信。同　时ＢｅｒｋｅｌｅｙＤＢ所有的操作都是通过一组ＡＰＩ接口，　因此不需要对查询语言进行解析，免去了执行计划　的生成，大大提升了效率。　Ｆｌａｓｈ　ＳｔｏｒｅｉＳ］主要是针对Ｘｂｏｘ和数据去重应用　设计基于闪存的ＫＶ存储系统，设计目标是高吞吐、　低延迟，使用Ｆｌａｓｈ敏感的数据结构和算法，减少内　存存储的ｋｅｙ的大小。Ｈａｓｈ　Ｓｔｏｒｅ系统主要由内存　的写缓冲区、内存的读缓冲区、内存的Ｈａｓｈ索引　（Ｈａｓｈ索引完全放在内存中，加速查询的性能）、内　韩旭等：使用固态硬盘管理主存ＫＶ数据库的虚拟内存　６８９　存的最近访问向量、内存的Ｂｌｏｏｍ　ｆｉｌｔｅｒ，以及闪存　上数据组织成为循环链表（闪存作为磁盘的二级　Ｃａｃｈｅ使用，采用日志的方式顺序写数据），磁盘上　数据的存储完全采用ＢＤＢ作为磁盘数据管理工具。　Ｆｌａｓｈ　Ｓｔｏｒｅ具有以下特点：描述了查询、更新和删　除操作的流程。Ｈａｓｈ表采用Ｃｕｃｋｏｏ哈希减少冲突。　使用多线程的方式来进行并发控制，主要有客户端　服务线程、刷写闪存线程、垃圾回收线程。针对不　同部分设计了不同类型的加锁。对于恢复，需要重　新加载生成Ｈａｓｈ索引，这就需要扫描所有闪存，耗　时，所以采用定期刷写索引到闪存。向多个节点扩　展可以使用分布式哈希，也可以采用更新节点进行　Ｈａｓｈ。　ＳｋｉｍｐｙＳｔａｓｈｔ６￣与Ｆｌａｓｈ　Ｓｔｏｒｅ类似，主要的不同　是采用的Ｈａｓｈ表是最原始的链表哈希，即减少　Ｈａｓｈ表的大小，在Ｈａｓｈ后面采用链表存储冲突数　据，整个链表都存储在闪存上，闪存上的数据采用　链表的方式把具有相同Ｈａｓｈ　Ｋｅｙ的连接起来。为了　减少链表的长度，采用两个哈希函数来解决冲突问　题，给搜索、插入和更新带来了麻烦。因为闪存空　间有限，所以对闪存空间回收来说，闪存上数据采　用链表方式进行组织，因此数据回收会有很大难度，　采用直接回收一个链表数据的方式。　３缓冲区的设计与实现　３．１固态硬盘特性介绍　固态硬盘是由控制单元和存储单元组成的，大　多数的固态硬盘采用闪存芯片作为其存储介质　Ｊ，　因为闪存是通过电子电路来存取数据，不存在机械　移动带来的延迟，所以闪存的数据定位所需要的时　间相比于传统磁盘要小很多。因此闪存芯片具有非　常高的随机读取速度，能从根本上解决磁盘中随机　渎性能低下的问题。除此之外，固态硬盘还具有其　他一些优秀的特性，比如节省电量、抗震好、散发　热量少和体积小等。　但是闪存除了拥有磁盘所有的读写性能外，还　有擦除这一特有的操作。闪存是基于块的存储结构，　块是擦除操作的基本单元。而页是闪存的读写操作　的基本单位，一个块一般具有３２或６４个页。闪存　的一次写操作是将一个页的数据变为０，当需要删　除或者重写这个数据时，需要擦除操作将这个页变　为１。闪存并不能支持原位更新，向闪存中写入一条　数据对这个数据块先执行擦除操作后，这个页中的　原有数据也需要重写到这个块中，所以擦除操作所　消耗的时间要远远大于写操作所要执行的时间【８Ｊ。　为了克服闪存芯片的物理特性，固态硬盘引入　了闪存转换层（ｌｆａｓｈ　ｔｒａｎｓｌａｔｉｏｎ　ｌａｙｅｒ，ＦＴＬ）来模拟块　设备的操作【９一州。ＦＴＬ维护了一个内部映射表来记　录逻辑地址和物理地址之间的映射关系，其对用户　是透明的。但是由于对闪存中一个数据区域的写操　作需要触发一个擦除操作，ＳＳＤ的随机写性能仍然　不是很高。　如表２所示【１¨，固态硬盘相比于传统磁盘，随　机读的性能提高了１８．６２倍，但是随机写却要低于　磁盘。因此，直接将数据库应用在固态硬盘上并不　能获得相应于闪存和磁盘ＩＯ性能比值而带来的提　引，需要根据固态硬盘的这些特性，优化数据　库对数据的操作，在充分利用固态硬盘高效的随机　读优点的同时，避免过多的随机写数据，以充分发　挥固态硬盘的性能。　Ｔａｂｌｅ　２　Ｐｅｒｆｏｒｍａｎｃｅ　ｃｏｍｐａｒｉｓｏｎ　ｂｅｔｗｅｅｎ　Ｄｉｓｋ　ａｎｄ　ＳＳＤ　表２磁盘与固态硬盘的性能比较　３．２缓冲区设计　在主存ＫＶ数据库中，当数据占据的主存容量　超过一定值后，这时再向数据库写人数据，数　据库就会根据一定的换入换出算法，选择一个数据　交换到虚拟内存中去。再将这个数据写入硬盘中对　应的虚拟内存文件区域，以达到释放一定的主存空　间来存放新写人数据的目的。此时应用程序对系统　发出频繁的写操作请求，将会有大量的数据非连续　地写入到虚拟内存中。同时，由于数据库需要保存　Ｊｏｕｒｎａｌ　ｏｆＦｒｏｎｔｉｅｒｓ　ｏｆＣｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ计算机科学与探索　２０１１，５（８）　写入硬盘数据的一些元信息，例如存储长度、数据　类型等，又增加了对硬盘的写的频率，且由于这些　元信息的数据量很小，这些写入操作又是粒度非常　小的随机写。虽然直接使用固态硬盘能够使主存　ＫＶ数据库对虚拟内存中数据进行读取操作时达到　用的主存空间是否已经达到限定值，如果达到则向　虚拟内存中写入相对访问次数较低的数据，以释放　相应的空间。这时数据库会根据一定的算法得到可　以交换到虚拟内存中的数据，同时将数据写入到写　缓冲区中，同时将数据库ｋｅｙ与ｖａｌｕｅ的哈希表中对　应ｖａｌｕｅ的指针指向写缓冲区中的相应位置。在缓　很高的性能，但是由于数据库向虚拟内存写入数据　实际上是大量的随机写，这样固态硬盘随机写性能　冲区中的数据实际上仍然是存放在主存中，原来对　差的缺点就成为该数据库系统的瓶颈。　针对上述问题，本文使用固态硬盘作为主存　ＫＶ数据库的虚拟内存，以提高数据随机读取的性　能，并针对固态硬盘的写操作特点，建立了一个以　固态硬盘块单位为大小的写缓冲区。这个缓冲区将　主存ＫＶ数据库中大量的对虚拟内存的随机写操作　在主存中缓存起来，当这个缓冲区数据写满时，将　这些数据一同写入到虚拟内存文件中。通过这种方　法，使得在利用固态硬盘高速的随机读数据性能的　同时，将多个对固态硬盘的随机写数据操作缓存、　合并，转化为一个连续的数据写入操作，从而提高　了主存ＫＶ数据库对虚拟内存数据写操作的速度。　内存　固态硬盘　数　缓　据　库　趸　换　冲　次连续　写　虚拟　内　、数　区　内存　存　据　Ｊ．　一认刈　Ｕ　Ｈ、Ｊ　随机读　Ｆｉｇ．１　Ｔｈｅ　ａｒｃｈｉｔｅｃｔｕｒｅ　ｏｆ　ｓｙｓｔｅｍ　图１系统结构　３．３数据操作　在ＫＶ数据库中，大部分数据操作都是Ｓｅｔ操作　（写）和Ｇｅｔ操作（读），下面主要介绍这两种操作下的　数据流程。　当应用程序向主存ＫＶ数据库发出写入数据请　求时，数据库在主存中为这个数据分配相应的主存　空间来存储数据。然后数据库查看当前数据库中占　数据分配的空间并没有释放，这样做的目的是对写　缓冲区数据进行读取操作时省却主存间复制的操　作消耗。对这部分数据的操作也是直接在主存中进　行，不需要从硬盘载人到主存这个过程。当写缓冲　区满时，数据库以追加写的方式在虚拟内存文件中　的末尾连续写入整个缓冲区中的数据，释放相应的　数据空间，并将哈希表中的指针指向虚拟内存空间　中的相应位置。　当应用程序向主存ＫＶ数据库发出读数据请求　时，数据库首先根据读请求的ｋｅｙ值找到哈希表中　对应的指针，并根据指针指向的位置读取数据。如　果所存放的数据在主存中，直接返回相应数据；若　数据在写缓冲区中，将哈希表中的指针指向具体存　放数据的位置，回收写缓冲区的相应空间；若数据　在虚拟内存中，根据哈希表中对应指针的位置读取　数据，并为其在主存分配相应空间，若此时数据库　占用的主存容量超过限定值，又会触发向虚拟内存　交换数据的请求。　３．４算法实现　基于３．３节的研究，本文实现了两种数据操作。　因为缓冲区中的数据也需要与数据库进行交互，所　以也需要对缓冲区中的数据进行管理，包括将映射　表中的指针指向缓冲区中的相应位置，从缓冲区读　出数据时标记位置可用和将新写人数据存放在缓　冲区释放的位置中。根据数据库对数据的操作，将　设计分为对虚拟内存的写操作和对数据的读操作，　实现如下：　算法１对虚拟内存的写操作　１．　Ｚ“８＋＿获得需要写入虚拟内存的值　２．　，／缓冲区为ｂｕｆｆｅｒ　３．　地址指针ｐｏｉｎｔｅｒｓ－－－ＮＵＬＬ　韩旭等：使用固态硬盘管理主存ＫＶ数据库的虚拟内存　６９１　４．　ｉｆ在ｂｕｆｅｒ中有被释放的空间ｔｈｅｎ　５．　ｐＤｆｎ　ｒ＋＿－空闲空间地址　６．　将ｖａｌｕｅ写入到ｐｏｉｎｔｅｒ指向的地址　７．　用ｐｏｉｎｔｅｒ更新映射表　８．　ｒｅｔｕｒｎＯＫ　９．　ｅｎｄ　ｉｆ　１０．　将ｖａｌｕｅ追加到ｂｕｆｅｒ中　１１．　ｐＤｊ　，Ｉ＋＿＿获得ｂｕｆｅｒ中地址　１２．　用ｐｏｉｎｔｅｒ更新映射表　１３．　ｉｆ　ｂｕｆｅｒ写满　ｌ４．　将ｂｕｆｅｒ追加连续写到ＳＳＤ中虚拟内存　１５．　ｆｏｒ　ｂｕｆｅｒ中每个数据　ｌ６．　ｐＤ　，一在虚拟内存中地址　１７．　用ｐｏｉｎｔｅｒ更新映射表　１８．　ｅｎｄ　ｆｏｒ　１９．　ｅｎｄｉｆ　２０．　ｒｅｔｕｒｎ　０Ｋ　算法２对数据的读操作　输入：需要读取数据的ｋｅｙ值ｋｅｙ　１．　／／缓冲区为ｂｕｆｅｒ，值为ｖａｌｕｅ　２．　地址指针ｐｏｉｎｔｅｒｓ－－ＮＵＬＬ　３．　获得ｖａｌｕｅ的地址ｐｏｉｎｔｅｒ＊－－ｄｉｃｔＦｉｎｄ（ｋｅｙ）　４．　ｉｆｐｏｉｎｔｅｒ指向内存中　５．　ｒｅｔｕｒｎ　ｐｏｉｎｔｅｒ　６．　ｅｎｄ　ｉｆ　７．　ｉｆｐｏｉｎｔｅｒ指向缓冲区中　８．　创建一个对象ｏｂｊｅｃｔ　９．　ｏ　ｃｆ＋．－从ｐｏｉｎｔｅｒ地址中读出值　１０．　标记ｂｕｆｅｒ中ｐｏｉｎｔｅｒ地址可用　１１．　用ｏｂｊｅｃｔ更新映射表　１２．　ｒｅｔｕｒｎ　ｏｂｊｅｃｔ　１３．　ｅｎｄｉｆ　１４．　ｉｆｐｏｉｎｔｅｒ指向虚拟内存中　１５．　创建一个对象ｏｂｊｅｃｔ　１６．　Ｄ　Ｐｃｆ＋＿－从ｐｏｉｎｔｅｒ地址中读出值　１７．　用ｏｂｊｅｃｔ更新映射表　１８．　ｒｅｔｕｒｎ　ｏｂｊｅｃｔ　１９．　ｅｎｄｉｆ　２０．　ｒｅｔｕｒｎＮＵＬＬ　这两种算法管理了数据存放于主存、缓冲区和　固态硬盘中虚拟内存这三种不同的情况，将要写人　虚拟内存中的数据写入缓冲区以达到减少随机写　的目的。　４空闲空问回收管理　向固态硬盘按块追加写盼方式将对固态硬盘的　大量随机写转化为向固态硬盘的一次连续写，而且　追加方式不存在ＳＳＤ数据块的擦除和重写。但是这　种追加方式会使虚拟内存在多次写入数据后变得　非常庞大，而且之前写入数据的数据块如果仍然存　储有少量的数据，那么这个数据块不能够被擦除。　因此在极端情况致使虚拟内存实际上只支持对其　分配空间大小的写入数量，造成了空间的浪费。当　数据库中频繁地与虚拟内存交换数据，在很短的时　间内，虚拟内存就能够被完全占用。因此，针对固　态硬盘数据块设计了空闲空间回收机制，将数据库　对虚拟内存的多个随机写转化为一个连续的读操　作和一个连续的写操作，提高了虚拟内存的空间回　收效率。　该机制将数据库中的虚拟内存以固态硬盘块的　大小为单元进行管理，每个数据块又分为若干个页　来存储数据。同时为虚拟内存中的每一个数据块维　护一个空闲空间统计信息，记录当前空闲空间的大　小和每个空闲的页号。因为数据从虚拟内存载人到　主存中是由Ｇｅｔ操作来完成，所以由Ｇｅｔ操作触发对　空闲空间信息的更新。当空闲空问的大小达到设定　值，则将整个数据块从虚拟内存中连续读出，并载　人到主存的回收缓冲区中。根据维护的这个数据块　的空闲空间统计信息，将当前写缓冲区中的数据写　到对应的回收缓冲区中，然后将这个回收缓冲区重　新连续地写回到这个虚拟内存数据块中。该方法采　用以连续读和连续写来替代多个随机写的方式，并　使原有数据能够达到“原位更新”，省却了更新原有　数据在数据库哈希表中对应指针的代价。　算法３在读操作中增加空间回收管理　输入：需要读取数据的ｋｅｙ值ｋｅｙ　１．　／／缓冲区为ｂｕｆｅｒ，值为ｖａｌｕｅ，当前数据块为　ｂｌｏｃｋ，回收缓冲区ｃ—ｂｕｆｅｒ　２．　地址指针ｐｏｉｎｔｅｒｓ－ＮＵＬＬ　６９２　Ｊｏｕｒｎａｌ　ｏｆＦｒｏｎｔｉｅｒｓ　ｏｆＣｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ计算机科学与探索　２０１１，５（８）　３．　获得ｖａｌｕｅ的地址ｐｏｉｎｔｅｒ￣－－－ｄｉｃｔＦｉｎｄ（ｋｅｙ）　库虚拟内存上读写性能的提升。选择Ｒｅｄｉｓ作为测　试使用的主存ＫＶ数据库，因为Ｒｅｄｉｓ在很多应用　场景中得到广泛使用，像ｄｉｇｇ、ｓｔａｃｋｏｖｅｒｆｌｏｗ和暴　４．　５．　ｉｆｐｏｉｎｔｅｒ指向内存中　ｒｅｔｕｒｎｐｏｉｎｔｅｒ　６．　ｅｎｄ　ｉｆ　雪等都在使用Ｒｅｄｉｓ数据库，同时其本身具有良好　的性能，并且提供了虚拟内存功能。本文使用的　７．　ｉｆｐｏｉｎｔｅｒ指向缓冲区中　８．　创建一个对象ｏｂｊｅｃｔ　９．　Ｄ　ｃ“一从ｐｏｉｎｔｅｒ地址中读出值　１Ｏ．　标记ｂｕｆｅｒ中ｐｏｉｎｔｅｒ地址可用　ｌ１．　用ｏｂｊｅｃｔ更新映射表　１２．　ｒｅｔｕｒｎ　ｏｂｊｅｃｔ　１３．　ｅｎｄｉｆ　１４．　ｉｆｐｏｉｎｔｅｒ指向虚拟内存中　１５．　创建一个对象ｏｂｊｅｃｔ　１６．　Ｄ　ｃ　从ｐｏｉｎｔｅｒ地址中读出值　１７．　用ｏｂｊｅｃｔ更新映射表　１　８．　易　一根据ｐｏｉｎＷｒ获得数据块ｉｄ　ｌ９．　更新当前ｂｌｏｃｋ的空间信息　２０．　ｉｆｂｌｏｃｋ空闲空间足够大　２１．　ｂｌｏｃｋ起始地址ｃ＿ｐｏｉｎｔｅｒ￣－－ａｄｄｒ（ｂｌｏｃｋ）　２２．　ｃ＿ｂｕｆｅｒ＊－－－从ｃ＿＿ｐｏｉｎｔｅｒ读人整个ｂｌｏｃｋ　２３．　ｂｕｆｅｒ＝ｍｅｒｇｅ（ｂｕｆｆｅｒ，ｃ＿ｂｕｆｅｒ）　２４．　从ｃ＿ｐｏｉｎｔｅｒ将ｂｕｆｅｒ写入ｂｌｏｃｋ中　２５．　更新ｂｌｏｃｋ空间信息　２６．　更新数据库映射表　２７．　ｅｎｄｉｆ　２８．　ｒｅｔｕｒｎ　ｏｂｊｅｃｔ　２９．　ｅｎｄｉｆ　３０．　ｒｅｔｕｒｎＮＵＬＬ　该算法使用读数据的操作触发数据库对于虚拟　内存空间的回收，将整个数据块的数据读出用于和　缓冲区中数据进行合并，且在合并时保持原数据块　数据的位置不变更，再写回原数据块中，同时也避　免了原有数据在映射表中的更新操作。　５实验结果与分析　５．１实验环境　本文的实验环境为一台ＰＣ机，ＣＰＵ为四核Ｉｎｔｅｌ　Ｃｏｒｅ２　Ｑｕａｄ　ＣＰＵ　Ｑ９６５０，主存为４　ＧＢ，使用５００　ＧＢ　磁盘和８０　ＧＢ　Ｉｎｔｅｌ固态硬盘作为测试平台。实验的　目的主要是测试本文写缓冲区机制对主存ＫＶ数据　Ｒｅｄｉｓ版本为２．２，这也是当前最新的稳定版本。　５．２实验结果　本文使用了Ｒｅｄｉｓ自带的ｂｅｎｃｈｍａｒｋ程序作为　测试程序。这个ｂｅｎｃｈｍａｒｋ会建立５０个客户端与数　据库进行通信，并执行相应的操作，来测试每秒钟　系统能完成的操作数。设置了每条测试命令发出ｌ０　万个操作请求，每个操作请求中的数据在给定的１０　万个数据中随机取出一个。为了测试不同数据大小　对算法性能的影响，对２Ｏ字节和１００字节的数据进　一∞　叮　、　蜊　谳行了测试。该测试针对Ｒｅｄｉｓ提供的三种命令Ｍｓｅｔ、４　２　Ｏ　８　　Ｓｅｔ、Ｇｅｔ，对如下四种情况分别进行了实验：（１）虚拟　内存存放在磁盘（Ｄｉｓｋ）；（２）虚拟内存直接存放在固　态硬盘（ｓｓＤ）；（３）增加了写缓冲区的固态硬盘虚拟　内存管理（ＳＳＤ＿ＢｕＦ）；（４）增加了空闲空间回收管理　（ＳＳＤ—ＧＣ）的虚拟内存。实验中开启了Ｒｅｄｉｓ的虚拟　内存功能，所有操作都是对虚拟内存中数据的操　作。测试结果如图２～图４。　■Ｄｉｓｋ　■ＳＳＤ　—ＳＳＤ　ＢＵＦ　■ＳＳＤ　ＧＣ　２０　１００　数据大ｄ￣ｙｔｅ　Ｆｉｇ．２　Ｐｅｒｆｏｒｍａｎｃｅ　ｃｏｍｐａｒｉｓｏｎ　ｏｎ　Ｍｓｅｔ　图２　Ｍｓｅｔ操作下的性能对比　５．３结果分析　在实验结果中，有一半实验的固态硬盘的性能　反而不如磁盘的高。虽然固态硬盘的随机读性能要　远远优于磁盘，但是由于其不支持原位更新，写前　６　４一　∞譬　一＼斟　一∞　譬　）／斟　餐　筠　鲫　∞　加　ｍ　Ｏ　韩旭等：使用固态硬盘管理主存ＫＶ数据库的虚拟内存　如　加　如　加　ｍ　Ｏ　６９３　×１０３　圈Ｄｉｓｋ　■ＳＳＤ　图ＳＳＤ　ＢＵＦ　■ＳＳＤ　ＧＣ　２０　１００　数据大／ｂ／Ｂｙｔｅ　Ｆｉｇ．３　Ｐｅｒｆｏｒｍａｎｃｅ　ｃｏｍｐａｒｉｓｏｎ　ｏｎ　Ｓｅｔ　图３　Ｓｅｔ操作下的性能对比　×１０３　■Ｄｉｓｋ　■ＳＳＤ　囹ＳＳＤ　ＢＵＦ　■ＳＳＤ　ＧＣ　２０　１００　数据大ｄＶＢｙｔｅ　Ｆｉｇ．４　Ｐｅｒｆｏｒｍａｎｃｅ　ｃｏｍｐａｒｉｓｏｎ　ｏｎ　Ｇｅｔ　图４　Ｇｅｔ操作下的性能对比　须擦除等特点，在一些特定的数据管理应用中，只　有采用适应固态硬盘特性的算法，才能最大幅度地　发挥固态硬盘的潜能。　由实验结果可以看到，使用写缓冲区的固态硬　盘作为虚拟内存的性能是最高的。加了空闲空间管　理机制后，因为数据库需要管理和维护每一个数据　块的空间，所以性能有所下降。实验中的固态硬盘　对Ｇｅｔ命令的提升并没有达到固态硬盘与磁盘在随　机读上性能的差距。这是因为虽然Ｇｅｔ命令是对数　据的读操作，但是当前测试时数据库需要将部分数　据交换到虚拟内存中以降低主存占用量，所以Ｇｅｔ　命令将数据读人到主存又会触发Ｒｅｄｉｓ将数据写回　到虚拟内存中的操作。因此实验中的一个Ｇｅｔ命令　实际上对应的是一个从虚拟内存中读取数据和一　个向虚拟内存中写入数据的操作。　从实验结果中可以看到，加入空闲空间管理和　写缓冲区对于Ｍｓｅｔ命令的性能提升是最大的，最　大可以达到４０％。这是由于Ｒｅｄｉｓ是一个基于事件　库的系统，一个操作命令会进入到事件库中以等待　执行，Ｒｅｄｉｓ会不断扫描这个库中的操作请求。而　Ｍｓｅｔ命令是对多个ｋｅｙ同时赋值，Ｒｅｄｉｓ从事件库中　读取并执行一个Ｍｓｅｔ命令，相当于只读取一次事　件库但是执行了多个Ｓｅｔ操作。这使得在整个Ｒｅｄｉｓ　执行时间中，Ｒｅｄｉｓ检测事件库的时间比例减少，真　正执行命令所占的时间比例上升。而对于Ｓｅｔ和Ｇｅｔ　操作，Ｒｅｄｉｓ每检测事件库只会执行一个数据操作，　检测事件库所消耗的时间比例较高。因此，Ｍｓｅｔ操　作的测试结果能够更加准确地反映本文使用固态　硬盘作为主存ＫＶ数据库虚拟内存，并且使用写缓　冲区和空闲空问管理机制对虚拟内存进行管理，提　升主存ＫＶ数据库的性能。　６总结　本文针对主存ＫＶ数据库对虚拟内存操作性能　较差的问题，提出了使用固态硬盘作为虚拟内存，　并设计了针对固态硬盘的写缓冲区机制。该机制将　多个随机写转化为一个连续写，进而提高了向虚拟　内存交换数据的执行效率。同时根据固态硬盘特点，　设计了基于数据块的空闲空问回收机制，由读数据　操作触发，将原数据块区域中的数据与缓冲区中数　据合并，并重写入这个数据区域中，避免了虚拟内　存空间的浪费。　Ｒｅｒｅｒｅｎｃｅｓ：　（１　Ｊ　Ｃｏｄｄ　Ｅ　Ｅ　Ａ　ｒｅｌａｔｉｏｎａｌ　ｍｏｄｅｌ　ｏｆ　ｄａｔａ　ｆｏｒ　ｌａｒｇｅ　ｓｈａｒｅｄ　ｄａｔａ　ｂａｎｋｓ［Ｊ］．Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ　ｏｆ　ｉｆｌｅ　ＡＣＭ，１９７０，１３（６）：３７７—　３８７．　［２］Ｄａｎｇａ　Ｉｎｔｅｒａｃｔｉｖｅ．Ｍｅｍｃａｃｈｅｄ［ＥＢ／ＯＬ］．【２０１１－０３－１９］，　ｈｔｔｐ：／／ｍｅｍｃａｃｈｅｄ．ｏｒｇ　【３】Ｓａｌｖａｔｏｒｅ　Ｓａｎｆｉｌｉｐｐｏ．Ｒｅｄｉｓ［ＥＢ／ＯＬ］．［２０Ｉ１－０３—１９Ｉ．ｈｔｔｐ：／／　ｒｅｄｉｓ．ｉｏ．　［４］Ｓｌｅｅｐｙｃａｔ　Ｓｏｆｔｗａｒｅ．ＢｅｒｋｅｌｅｙＤＢ［ＥＢ／ＯＬ］＿ｆ２０１１－０３—２１１．　６９４　Ｊｏｕｒｎａｌ　ｏｆＦｒｏｎｔｉｅｒｓ　ｏｆＣｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ计算机科学与探索　２０１１，５（８）　ｈｔｔｐ：Ｈｗｗｗ．ｏｒａｃｌｅ．ｃｏｍ／ｔｅｃｈｎｅｔｗｏｒｋ／ｄａｔａｂａｓｅ／ｂｅｒｋｅｌｅｙｄｂ／　ｏｖｅｒｖｉｅｗ／ｉｎｄｅｘ．ｈｔｍ１．　ｍ　Ｊ　Ｍ．Ａ　ｓｐａｃｅ—ｅｆｆｉｃｉｅｎｔ　ｆｌａｓｈ　ｔｒａｎｓｌａｔｉｏｎ　ｌａｙｅｒ　［１０】　Ｋｉｍ　Ｊ．Ｋｉｆｏｒ　ｃｏｍｐａｃｔ—ｆｌａｓｈ　ｓｙｓｔｅｍｓ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　【５】Ｄｅｂｎａｔｈ　Ｂ，Ｓｅｎｇｕｐｔａ　Ｓ，Ｌｉ　Ｊｉｎ．ＦｌａｓｈＳｔｏｒｅ：ｈｉｇｈ　ｔｈｒｏｕｇｈ—　ｈｐｕｔ　ｐｅｒｓｉｓｔｅｎｔ　ｋｅｙ—ｖａｌｕｅ　ｓｔｏｒｅ［Ｊ］．Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　Ｃｏｎｓｕｍｅｒ　Ｅｌｅｃｔｒｏｎｉｃｓ，２００２，４８（２）：３６６—３７５．　ａｎｇ　Ｚｈｉｃｈａｏ，Ｚｈｏｕ　Ｄａ，Ｍｅｎｇ　Ｘｉａｏｆｅｎｇ．Ｓｕｂ—Ｊｏｉｎ：　［１１】　ＬｉＶＬＤＢ　Ｅｎｄｏｗｍｅｎｔ，２０１０，３（１，２）：１４１４－１４２５．　【６】Ｄｅｂｎａｔｈ　Ｂ，Ｓｅｎｇｕｐｔａ　Ｓ，Ｌｉ　Ｊｉｎ．ＳｋｉｍｐｙＳｔａｓｈ：ＲＡＭ　ｓｐａｃｅ　ｓｋｉｍｐｙ　ｋｅｙ－・ｖａｌｕｅ　ｓｔｏｒｅ　ｏｎ　ｆｌａｓｈ・－ｂａｓｅｄ　ｓｔｏｒａｇｅ［Ｃ］／／Ｐｒｏ—　ｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　２０１　ｌ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｍａｎ—　ｑｕｅｒｙ　ｏｐｔｉｍｉｚａｔｉｏｎ　ａｌｇｏｒｉｈｍ　ｔｆｏｒ　ｌｆａｓｈ—ｂａｓｅｄ　ｄａｔａｂａｓｅ［Ｊ］．　Ｊｏｕｒｎａｌ　ｏｆ　Ｆｒｏｎｔｉｅｒｓ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｔｅｃｈｎｏｌｏｇｙ，　２０１０，４（５）：４０１—４０９．　＿＿ｇｎ　ｏｆ　ｆｌａｓｈ—ｂａｓｅｄ　ＤＢＭＳ：ａｌｌ　ｉｎ—ｐａｇｅ　［１２］　Ｌｅｅ　Ｓ，Ｍｏｏｎ　Ｂ．Ｄｅｓｉａｇｅｍｅｎｔ　ｏｆ　Ｄａｔａ（ＳＩＧＭＯＤ’１　１）．Ｎｅｗ　Ｙｏｒｋ，Ｎ　ＵＳＡ：　ＡＣＭ．２０１１：２５－３６．　ｌｏｇｇｉｎｇ　ａｐｐｒｏａｃｈ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　２００７　ＡＣＭ　ＳＩＧＭ０Ｄ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｍａｎａｇｅｍｅｎｔ　ｏｆ　Ｄａｔａ（ＳＩＧＭＯＤ’０７）．Ｎｅｗ　Ｙｏｒｋ，Ｎ　ＵＳＡ：ＡＣＭ，２Ｏｏ７：　５５－６６．　ｌａｓｈ　ｍｅｍｏｒｙ　【１３】　Ｌｅｅ　Ｓ，Ｍｏｏｎ　Ｂ，Ｐａｒｋ　Ｃ，ｅｔ　ａ１．Ａ　ｃａｓｅ　ｆｏｒ　ｆ【７】Ｍｔｒｏｎ．Ｓｏｌｉｄ　ｓｔａｔｅ　ｄｒｉｖｅ　ＭＳＤ—ＳＡ１１Ａ　３０３５　ｐｒｏｄｕｃｔ　ｓｐｅｃｉ—　ｉｆｃａｔｉｏｎ［ＥＢ／ＯＬ］．（２００８）［２００９—０７—１９］．ｈｔｔｐ：／／ｍｔｒｏｎ．ｎｅｔ／Ｕｐｌｏａｄ＿　Ｄａｔａ／Ｓｐｅｃ／ＡＳｉＣ／ＭＯＢＩ／ＳＡＴＡ／ＭＳＤ—ＳＡＴＡ３０３５ｒｅｖ０．４．ｐｆｄ．　＿ＳＳＤ　ｉｎ　ｅｎｔｅｒｐｒｉｓｅ　ｄａｔａｂａｓｅ　ａｐｐｌｉｃａｔｉｏｎｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　Ｏｆ　ｔｈｅ　２００８　ＡＣＭ　ＳＩＧＭＯＤ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　【８】Ｓａｍｓｕｎｇ　Ｅｌｅｃｔｒｏｎｉｃｓ．１　Ｇ　ｘ　８Ｂｉｔ／２Ｇ　ｘ　８Ｂｉｔ／４Ｇ　ｘ　８Ｂｉｔ　ＮＡＮＤ　ｆｌａｓｈ　ｍｅｍｏｒｙ，ｖｅｒｓｉｏｎ　１．１【ＥＢ／ＯＬ］．（２００７—０６—１８）　Ｍａｎａｇｅｍｅｎｔ　ｏｆ　Ｄａｔａ（ＳＩＧＭＯＤ’０８）．Ｎｅｗ　Ｙｏｒｋ，Ｎ　ＵＳＡ：ＡＣＭ．２００８：１０７５－１０８６．　【２００９一Ｏ６—１５１．ｈｔｔｐ：／／ｗｗｗ．ａｌｌｄａｔａｓｈｅｅｔ．ｃｏｍ／ｄａｔａｓｈｅｅｔ—　ｐｄｆ／ｐｄｆ／１３９７８８／ＳＡＭＳＵＮＧ／Ｋ９ＷＡＧ０８ＵＩＡ．ｈｔｍ１．　【９】Ｉｎｔｅｌ－Ｃｏｒｐｏｒａｔｉｏｎ．Ｕｎｄｅｒｓｔａｎｄｉｎｇ　ｔｈｅ　ｆｌａｓｈ　ｔｒａｎｓｌａｔｉｏｎ　附中文参考文献：　［１１】梁志超，周大，孟小峰．Ｓｕｂ—Ｊｏｉｎ：面向闪存数据库的查　ｌａｙｅｒ（ＦＴＬ）ｓｐｅｃｉｉｆｃａｔｉｏｎｓ［ＥＢ／ＯＬ］．（１９９８—１２）［２００９—０６—１５１．　ｈｔｔｐ：／／ｗｗｗ．ｅｍｂｅｄｄｅｄｆｒｅｅｂｓｄ．ｏｒｇ／Ｄｏｃｕｍｅｎｔｓ／Ｉｎｔｅｌ一兀Ｌ．ｐｄｆ．　询优化算法［Ｊ】．计算机科学与探索，２０１０，４（５）：４０１－－４０９．　ＨＡＮ　Ｘｕ　ｗａｓ　ｂｏｒｎ　ｉｎ　１９８９．Ｈｉｓ　ｒｅｓｅａｒｃｈ　ｉｎｔｅｒｅｓｔｓ　ｉｎｃｌｕｄｅ　ｌａｓｈ—ｂａｓｅｄ　ｆｄａｔａｂａｓｅ　ａｎｄ　ｋｅｙ－ｖａｌｕｅ　ｓｔｏｒｅ，ｅｔｃ　韩旭（１９８９一），男，山东曹县人，主要研究领域为基于闪存的数据库，ＫＶ存储等。　ＣＡＯ　Ｗｅｉ　ｗａｓ　ｂｏｒｎ　ｉｎ　１９７５．Ｓｈｅ　ｒｅｃｅｉｖｅｄ　ｈｅｒ　Ｐｈ．Ｄ．ｄｅｇｒｅｅ　ｆｒｏｍ　Ｒｅｎｍｉｎ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｃｈｉｎａ　ｉｎ　２００９．　Ｎｏｗ　ｓｈｅ　ｉｓ　ａ　ｌｅｃｔｕｒｅｒ　ａｔ　Ｓｃｈｏｏｌ　ｏｆ　Ｉｎｆｏｒｍａｔｉｏｎ，Ｒｅｎｍｉｎ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｃｈｉｎａ，ａｎｄ　ｔｈｅ　ｍｅｍｂｅｒ　ｏｆ　ＣＣＦ．Ｈｅｒ　ｒｅｓｅａｒｃｈ　ｉｎｔｅｒｅｓｔｓ　ｉｎｃｌｕｄｅ　ｈｉｇｈ　ｐｅｒｆｏｒｍａｎｃｅ　ｄａｔａｂａｓｅ，ｄａｔａｂａｓｅ　ｔｕｎｉｎｇ　ａｎｄ　ｆｌａｓｈ—ｂａｓｅｄ　ｄａｔａｂａｓｅｓ．　曹巍（１９７５一），女，辽宁沈阳人，２００９年于中国人民大学获得博士学位，现为中国人民大学信息学院　讲师，ＣＣＦ会员，主要研究领域为高性能数据库，数据库自管理自调优，闪存数据库。　ＭＥＮＧ　Ｘｉａｏｆｅｎｇ　ｗａｓ　ｂｏｒｎ　ｉｎ　１　９６４．Ｈｅ　ｒｅｃｅｉｖｅｄ　ｈｉｓ　Ｐｈ．Ｄ．ｄｅｇｒｅｅ　ｆｒｏｍ　Ｃｈｉｎｅｓｅ　Ａｃａｄｅｍｙ　ｏｆ　Ｓｃｉｅｎｃｅｓ　ｉｎ　１９９９．Ｎｏｗ　ｈｅ　ｉｓ　ａ　ｐｒｏｆｅｓｓｏｒ　ａｎｄ　ｄｏｃｔｏｒａｌ　ｓｕｐｅｒｖｉｓｏｒ　ａｔ　Ｒｅｎｍｉｎ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｃｈｉｎａ，ａｎｄ　ｔｈｅ　ｓｅｎｉｏｒ　ｍｅｍ．　ｂｅｒ　ｏｆ　ＣＣＦ　Ｈｉｓ　ｒｅｓｅａｒｃｈ　ｉｎｔｅｒｅｓｔｓ　ｉｎｃｌｕｄｅ　Ｗｅｂ　ｄａｔａ　ｍａｎａｇｅｍｅｎｔ，ｃｌｏｕｄ　ｄａｔａ　ｍａｎａｇｅｍｅｎｔ，ｍｏｂｉｌｅ　ｄａｔａ　ｍａｎａｇｅｍｅｎｔ，ＸＭＬ　ｄａｔａ　ｍａｎａｇｅｍｅｎｔ，ｆｌａｓｈ—ａｗａｒｅ　ＤＢＭＳ　ａｎｄ　ｐｒｉｖａｃｙ　ｐｒｏｔｅｃｔｉｏｎ．　孟小峰（１９６４一），男，１９９９年于中国科学院获得博士学位，现为中国人民大学教授、博士生导师，ＣＣＦ　高级会员，主要研究领域为Ｗｅｂ数据管理，云数据管理，移动数据管理，ＸＭＬ数据管理，闪存数据库　管理，隐私保护。　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文