海外学人-刘辉教授

image      刘辉现为美国华盛顿大学(University of Washington) 电子工程系正教授。刘教授1988年毕业于复旦大学电子系,1992年获得美国波特兰州立大学(Portland State University)电子工程专业硕士学位,并于1995年获得美国奥斯丁德州大学(UT Austin)电子工程专业博士学位。他于2009年获选美国电气电子工程师协会院士(IEEE Fellow),评语为: 对宽带蜂窝和移动广播的全球标准做出贡献(Citation:for contributions to global standards for broadband cellular and mobile broadcasting)。

      刘教授在学术杂志上发表了40多篇论文,并拥有30多项专利,他还是TD-SCDMA技术的主要设计者之一。他的研究方向包括无线网络,多媒体信号处理等。点击这里进入刘教授主页。他的联系方式为:

Hui Liu
Professor
Communications and Signal Processing
307P EEB
Box 352500
University of Washington
Seattle, WA 98195

(没有打分)

龙星课程: 局部性原理在计算机和分布式系统中的应用

【今年的龙星课程,张晓东教授讲授了他的杀手锏:data locality。 在首篇的slides里边,张教授讲了下当前系统研究面临的问题和如何作一个 balancing system 。上次 Lawrence National Laboratory 的人来我们这里,我问他为什么 Blue Gene 的 CPU frequency 这么低,他说主要考虑的是 power density。 张教授也强调了 application, runtime system, kernel & arch co-design 来解决问题的重要性。 我们也在作类似的  java runtime, kernel & arch 的 co-design。 不过 co-design 工业界应该是领先很多。 这就是张教授牛的原因了,很多工作直接被工业界拿走应用在 product 中。非常喜欢 张教授的一句话: Practical benefits in the real world often result from basic research at a fundamental level.】

课件下载地址 http://mail.ustc.edu.cn/~wbdai/dragonstar/doc/dragonStar-2010-USTC.rar

http://mail.ustc.edu.cn/~wbdai/dragonstar/html/course.html
课程简介


在计算机系统中,数据的存储、访问和传输已成为阻碍系统性能的主要瓶颈,访问数据的速度远远低于计算的速度,而对数据访问的需求已经成为计算机运行的主要部分。 数据在计算机系统中的存储层次也变得越来越深:从硬件快速寄存器(Registers)到快速存储器(Cache)再到主存的DRAM,通过数据总线,系统可以与各种磁盘,如半导体的固态存储器(Solid State Device)或机械的硬磁盘等。通过互联网,计算机之间还可以通过网络进行大规模的远程存储、访问和通讯。
计算机系统中的数据访问的速度和效率是由两个基本要素决定的:(1)点与点之间的传输的速度(Bandwidth);(2)在某点读或写数据的时间延迟(Latency)。在过去的20多年里,在计算机的各个不同的联结点之间数据的传输速度,有了很大的提高,但数据访问的延迟却没能有效地改善。为了解决这一对越来越突出的矛盾,在计算机系统设计和实现中,三种最有效的硬件或软件的方法是:缓存(Caching),备份(Replication)和预取(Prefetching)。

课程大纲


这门课以上面提到的三个基本技术为核心,全面介绍计算机各个存储层面上的最有代表性和最先进的数据管理方法。课程安排如下:

(一) 硬件快速存储器(Cache)的设计与改进

(1) 基本结构
(2) 命中率和访问延迟的取舍
(3) 高命中率和低访问延迟Cache的设计
(4) 多核处理器(Multicore)中的Cache管理

(二) 主存DRAM内局部性(Locality)的挖掘

(1) DRAM缓存区(row buffer)的结构
(2) 在DRAM内局部性丢失的原因
(3) 一种保留局部性的内存地址空间的映射方法
(4) 嵌入Cache 的DRAM的设计与系统应用

(三) 内存和磁盘管理中的核心技术:替换算法

(1) LRU算法优点以及难以解决的问题
(2) LIRS算法是如何解决LRU问题的
(3) Clock-pro: LIRS是如何实现在操作系统内核的
(4) BP-wrapper:消除替换算法在系统实现中的同步竟争

(四) 提高操作系统对磁盘的管理功能和效率

(1) 操作系统对磁盘管理的局限性
(2) 扩大操作系统的视野去获得关键的磁盘数据存储地址信息
(3) DULO-Caching和DULO-Prefetchin:感知磁盘数据分布的缓存(Caching)和预取(Prefetching)方法以及系统实现

(五) 固态闪存系统(Solid State Device Flash Memory)

(1) SSD Flash Memory的结构和性能
(2) SmartSaver: 利用闪存来降低磁盘能耗
(3) SSD的读、写,以及缓存的高效管理

(六) 在互联网和无线网上的数据管理和有效传输

(1) Stretched Exponential Distribution: 为什么P2P在互联网上是传输多媒体的一种最有效的方法?
(2) 数据缓存在无线网上的作用

(1个打分, 平均:5.00 / 5)

LPC2009、数据去重技术 Data De-Duplication、海外人物 Mingming Cao

Linux Plumbers Conference (http://linuxplumbersconf.org/) 自2008年开办首届以来已经成为了 Linux 业界有名的会议, (翻译这个名称比较难,是 “Linux 管道工会议” 还是 意译为 “Linux 底层技术会议”?) 在其开办之前,世界上已有三大 Linux会议,每年产出无数高质量 paper 和 实用开源项目:分别是加拿大 LinuxSymposium.org 覆盖北美区,德国 Linux Kongress 覆盖欧洲区,和 Linux.Conf.Au 覆盖澳纽区;可惜一直无一在美国本土,与其顶级技术诞生地很不相称,花旗国人对此深感痛心疾首,于是在2008年开始有人有组织地预谋 本土的 “Linux 底层技术会议”。终于在08年9月份在 俄勒冈州 波特兰州立大学(此处关于 Portland State University 也需另文另表) 得以实现其”一大”会议。 (此处 colyli 同学当年是其一大见证人,希望有机会也对参加过的技术会议作些总结) (本人当年本来也有机会见证一大的,可惜被万恶的 bureaucracy 审查了两个月才发给 visa, 等到花儿都谢了)。 LPC 诞生之后,显而易见的就是取代了原有北美区 LinuxSymposium 的光辉, 看  LS 2009 Proceedings 就知道了,几乎没有名人到访 ;名人的 paper 都投奔 LPC 去了)

且看 LPC 2009年会议议程 包括了 Keynote, Linus Torvalds – An Advanced Git Tutorial, 音频、网络、实时、安全、启动、内核/用户态接口、存储、嵌入式、XWindow、等多方面的子会议,本文重点详述 其中存储子会议的一个环节: 由 Mingming Cao (from US IBM Linux Technology Center) 做的关于 Linux Data De-duplicaton 的演讲 [slides], 在  Linux Foundation 本来还有它的 视频,可是我身在亚洲区多个ISP网络条件下尝试过,从来没有成功地播放完过。(说明 Linux Foundation 的视频站仍然欠缺访问速度,看身在辽国的同学有没有办法把它转移到 youtube 或者 … )

虽然命题 名为 “Linux Data De-duplicaton”, 但里面所提到的技术并不限定于 Linux, 并且根据 slides 所看到的,可以作为 数据去重技术 的一个很好的入门 (不知视频中现场还说了些什么,观众有些什么提问?):

  1. 当今世界正在经历着数据爆炸,对抗数据冗余是很有必要的;
  2. 已存在的技术: 压缩、链接、Copy on write ;但都无力对抗 复制、修订、备份 中产生的冗余;
  3. 数据去重技术 是  一种通过减少冗余数据来达到减少存储空间需求的方法。
    通过在底层存储级别上扫描,对冗余块只保留唯一一份,其它冗余块替换到唯一块的指针引用;
    可以实现在文件级别、块级、甚至 bit 级别;
  4. 针对备份、归档、虚拟化所产生的冗余 特别有效地减少了存储空间需求;
  5. 有人可能认为磁盘已经足够廉价了,但冗余数据引起的额外能源、灾备、和人力管理成本也是不可估量的;
  6. 实现数据去重所面临的难题:
    - 去重处理 消耗了额外 CPU 内存资源;
    - 进一步产生了文件/文件系统碎片化;
    - 增加了丢失数据的风险;
    - 与加密系统不能良好合作;
    - Hash 冲突;
  7. 压缩比在 2:1 到 10:1
  8. 处理方法: 在数据源头(客户端)和数据终点(存储系统) 进行去重 的优缺点比较;
  9. 处理时机: Inline 与 Post-process 的优缺点比较
  10. 在 btrfs 上的实践;
  11. 讨论: 在 user space 实现去重的可能性;
  12. 结论: Linux 需要 Data De-Duplication 技术以 fight against 数据膨胀。

附:演讲者 Mingming Cao 介绍:

曹明明: 山东人,山东师范大学附中 ‘88 级,后来赴美 俄勒冈州立大学学习,工作于 US IBM LTC, 曾多次参与 Linux Kernel Summit 顶级技术会议发表演讲;与上海籍 曹南豫 先生相知、相识于 俄勒冈州立大学,并相爱、结婚,育有二女,一家人幸福地生活在波特兰;并且其夫工作也是 Storage Software Engineer, 可羡慕地称之为 … 神仙眷侣不为过。

其个人 facebook 页面在: http://www.facebook.com/caomingming

(2个打分, 平均:3.00 / 5)

海外学人- Shan Lu教授

Shan Lu 现为美国University of Wisconsin – Madison大学计算机系助理教授。Lu 教授2008年底毕业于UIUC计算机系,师从著名的YY ZHOU教授。

陆教授的研究方向是计算机系统,主要是在系统可靠性及并行软件系统方面。

点击http://pages.cs.wisc.edu/~shanlu/进入Lu 教授主页(好象还是头衔教授- Clare Boothe Luce Assistant Professor , 比较少见)。 她的联系地址是:

Computer Science Department
University of Wisconsin – Madison
1210 W. Dayton Street,
Madison, WI 53706.
Email: shanlu at cs.wisc.edu

(4个打分, 平均:4.00 / 5)

海外学人-赵荣教授

Prof. Rong Zhao 赵荣曾为纽约石溪大学 (Stony Brook University) 助理教授,现在是该校 “无线与信息技术中心” 软件部门 总监 (Director at Center of Excellence in Wireless and Information Technology (CEWIT))。赵教授1996年毕业于清华大学计算机系,2001年获得美国维尼州立大学(Wayne State University at Detroit, Michigan)计算机专业博士学位。自2001年至2006年担任纽约石溪大学计算机系助理教授,2006年转至该校 CEWIT 软件系统部门 任总监。 (根据其CV, 其06年后似乎已卸任教职,全职任 软件部门总监,但我们还是继续尊称赵教授吧。)

根据 CEWIT 描述,其作用类似于一个校办公司,让学校研究的最先进技术能够迅速应用于工业界,让广大师生能有一个工业界进行理论联系实践的地方;同时这个校办公司与业界 Cisco, IBM 开展广泛合作,在无线信息技术研究方面具有领先地位;这种模式值得学习。

赵教授的研究方向包括数据挖掘,信息可视化,和软件工程等。点击这里进入赵教授主页。他的联系地址是:

Rong Zhao, Ph.D.

Center of Excellence in Wireless and Information Technology (CEWIT)
Stony Brook University
Stony Brook, NY 11794-2200
631.632.4627 (voice)
631.632.4653 (fax)
rzhao AT cs DOT stonybrook DOT edu

(2个打分, 平均:5.00 / 5)

海外学人- Lin Tan教授

Lin Tan现为加拿大滑铁卢大学(University of Waterloo)ECE系助理教授。Tan教授2003年本科毕业于浙江大学计算机系;2009年毕业于UIUC计算机系,师从著名的YY ZHOU教授。

Tan教授的研究方向包括软件可靠性、软件工程、安全、系统,集中于使用跨学科方法,如机器学习、数据挖掘、计算机体系结构及程序分析的方法解决系统可靠性问题(英文如下:
Software reliability; Software engineering; Security; Systems; Focusing on using interdisciplinary techniques such as machine learning, data mining, computer architecture and program analysis to address systems reliability problems )。

点击http://www.ece.uwaterloo.ca/~lintan/进入教授主页。她的联系地址是:

Electrical and Computer Engineering
University of Waterloo
200 University Avenue West
Waterloo, Ontario, N2L 3G1
Email: lintan at uwaterloo.ca

(4个打分, 平均:5.00 / 5)

海外学人-王卫朝教授

image      王卫朝现为美国北卡大学(UNC Charlotte)软件和信息系统系副教授。王教授1998年毕业于清华大学计算机系,2000年获得该系硕士学位,并于2005年获得美国普渡大学(Purdue University)计算机专业博士学位。

      王教授的研究方向包括网络协议设计,无线网络,和网络安全等。点击这里进入王教授主页。他的联系地址是:

Weichao Wang

Assistant Professor
Department of Software and Information Systems
University of North Carolina at Charlotte
Phone: (704) 687-7987
Fax: (704) 687-6065
Email: weichaowang at uncc.edu

(没有打分)

海外学人-吴鑫涛教授

image      吴鑫涛现为美国北卡大学(UNC Charlotte)软件和信息系统系副教授。吴教授1994年毕业于中国科大信息科学系,1997年获得中国空间技术研究院计算机工程专业硕士学位,并于2001年获得美国乔治梅森大学(George Mason University)信息技术专业博士学位。

      吴教授的研究方向包括数据挖掘,数据安全,和社交网络分析等。点击这里进入吴教授主页。他的联系地址是:

Xintao Wu

Associate  Professor & Data Privacy Lab Director
SIS Department, College of Computing and Informatics
University of North Carolina at Charlotte

Office: Woodward Hall 333E, E-mail: xwu at uncc.edu
Phone: (704) 687-8586  Fax: (704)687-4893
9201 Univ City Blvd 
Charlotte, NC 28223

(1个打分, 平均:2.00 / 5)