论文部分内容阅读
要是找不到一个好的数据组织方法,我恐怕得不断购买新的硬盘以保持所有需要的数据都留在硬盘上。
总的来说,我是一个不太注重保存资料的人,但是毕竟还留下了些编程序时养成的习惯,把日常工作数据有规律地进行备份还是要多少做做的。但是我最近发现,这个看似简单的备份工作越来越困难了,倒不是技术上难以实现,而是我很难从浩如烟海的光盘和硬盘里面找到备份好的东西。
我有一个光盘包,里面是历年来备份下来的文档和邮件数据。前几年的备份都不会超过一张光盘——都是文档和邮件,即使稍微多一些,压缩一下也可以绰绰有余地放进一张CDROM。但是最近不行了。工作文档的数据量没有增加多少,但是电子邮件就像吃了激素一样体积飞涨。公关公司发来的邮件除了新闻稿,大多还要附带几张照片,同事和朋友们也都在兴致勃勃地通过邮件交换照片、音乐甚至视频短片,更有些热心人不断地在邮件列表里面发送折扣赠券。这些东西可比几百字的文本邮件消耗更多的空间,而且还几乎无法压缩。于是我的邮件数据文件迅速增加到GB级别,还好硬盘空间也在不断增加,在实际使用中并没有什么困难,但是想在一张CD光盘上备份数据再也不可能了。幸亏我们有了DVD刻录机,工作文件的备份还不算困难,平时积累的数码照片或音乐文件相对于可以刻录4.5GB数据的DVD盘片也不算大容量。尽管如此,毕竟硬盘空间还是挺便宜的,我尽量在硬盘上保留所有的东西,这样在需要的时候总可以比较快地找到。
碰巧最近我常用的几台电脑都经历了一次重新安装操作系统的过程。既然要装新系统,把硬盘信息完整地备份一下还是有必要的,这一下我就发现问题了。三台电脑大约有上百GB的数据需要备份——各种MP3和APE音乐、多年积累的数码照片、各种PDF资料还有下载的高清晰电影——光是把它们分门别类地刻盘就花了我好一阵功夫。刻录完成,我看着满满一包新刻的光盘,突然一个问题跳了出来,本来志得意满的心情消失无踪了—我怎么从这几十张光盘里面找到我需要的文件呢?
对文本类型的数据,不论Google的桌面搜索程序还是Windows缓慢的搜索功能,好歹都能帮我找到它们。但是音乐、视频和照片可就困难了,除非我详细地对所有的多媒体文件进行改名和注释工作,否则积累一定时间它们就会变成难以处理的恶梦—我明明知道需要的东西就在硬盘上,但几乎不可能快速准确地找到一首歌或一张照片。这还是当数据都在硬盘上的时候,一旦它们被刻录到光盘上,那可就更困难了。除非我在备份的时候就有精细的分类,并且做好了完善的光盘目录,否则我唯一的选择可能就是把它们全部复制回硬盘再进行搜索。我可从来没想过在光盘上直接进行搜索—速度太慢了,还得一张一张地换盘。换句话说,要是找不到一个好的数据组织方法,我恐怕得不断购买新的硬盘以保持所有需要的数据都留在硬盘上。
很多人可能会看不起我这种懒于整理数据的习惯,但是我的看法是既然电脑有这么强大的信息处理能力,为什么不能让它们去完成这些毫无乐趣的分类和索引工作呢。这时我才意识到《数字化生存》的作者提到的“关于信息的信息”最有价值是多么的正确。这些原始数据都在我手里,但是至今我们对多媒体数据仍然没有什么有效的自动整理方法—除了给文件手工添加歌曲名、演唱者、专辑名称等标签,我们几乎无法像搜索文本那样简单地从硬盘中捞出你需要的歌曲文件,更别提照片和视频文件了。
据说Google正在研究多媒体搜索方面的技术,他们目前也有一个图像搜索功能,但是那是根据网页上的文字判断其相关性的,纯粹的多媒体数据搜索我还没有看到成功的产品。我不禁开始幻想,在这个领域会不会成为一个新的爆发百万富翁的热点。
总的来说,我是一个不太注重保存资料的人,但是毕竟还留下了些编程序时养成的习惯,把日常工作数据有规律地进行备份还是要多少做做的。但是我最近发现,这个看似简单的备份工作越来越困难了,倒不是技术上难以实现,而是我很难从浩如烟海的光盘和硬盘里面找到备份好的东西。
我有一个光盘包,里面是历年来备份下来的文档和邮件数据。前几年的备份都不会超过一张光盘——都是文档和邮件,即使稍微多一些,压缩一下也可以绰绰有余地放进一张CDROM。但是最近不行了。工作文档的数据量没有增加多少,但是电子邮件就像吃了激素一样体积飞涨。公关公司发来的邮件除了新闻稿,大多还要附带几张照片,同事和朋友们也都在兴致勃勃地通过邮件交换照片、音乐甚至视频短片,更有些热心人不断地在邮件列表里面发送折扣赠券。这些东西可比几百字的文本邮件消耗更多的空间,而且还几乎无法压缩。于是我的邮件数据文件迅速增加到GB级别,还好硬盘空间也在不断增加,在实际使用中并没有什么困难,但是想在一张CD光盘上备份数据再也不可能了。幸亏我们有了DVD刻录机,工作文件的备份还不算困难,平时积累的数码照片或音乐文件相对于可以刻录4.5GB数据的DVD盘片也不算大容量。尽管如此,毕竟硬盘空间还是挺便宜的,我尽量在硬盘上保留所有的东西,这样在需要的时候总可以比较快地找到。
碰巧最近我常用的几台电脑都经历了一次重新安装操作系统的过程。既然要装新系统,把硬盘信息完整地备份一下还是有必要的,这一下我就发现问题了。三台电脑大约有上百GB的数据需要备份——各种MP3和APE音乐、多年积累的数码照片、各种PDF资料还有下载的高清晰电影——光是把它们分门别类地刻盘就花了我好一阵功夫。刻录完成,我看着满满一包新刻的光盘,突然一个问题跳了出来,本来志得意满的心情消失无踪了—我怎么从这几十张光盘里面找到我需要的文件呢?
对文本类型的数据,不论Google的桌面搜索程序还是Windows缓慢的搜索功能,好歹都能帮我找到它们。但是音乐、视频和照片可就困难了,除非我详细地对所有的多媒体文件进行改名和注释工作,否则积累一定时间它们就会变成难以处理的恶梦—我明明知道需要的东西就在硬盘上,但几乎不可能快速准确地找到一首歌或一张照片。这还是当数据都在硬盘上的时候,一旦它们被刻录到光盘上,那可就更困难了。除非我在备份的时候就有精细的分类,并且做好了完善的光盘目录,否则我唯一的选择可能就是把它们全部复制回硬盘再进行搜索。我可从来没想过在光盘上直接进行搜索—速度太慢了,还得一张一张地换盘。换句话说,要是找不到一个好的数据组织方法,我恐怕得不断购买新的硬盘以保持所有需要的数据都留在硬盘上。
很多人可能会看不起我这种懒于整理数据的习惯,但是我的看法是既然电脑有这么强大的信息处理能力,为什么不能让它们去完成这些毫无乐趣的分类和索引工作呢。这时我才意识到《数字化生存》的作者提到的“关于信息的信息”最有价值是多么的正确。这些原始数据都在我手里,但是至今我们对多媒体数据仍然没有什么有效的自动整理方法—除了给文件手工添加歌曲名、演唱者、专辑名称等标签,我们几乎无法像搜索文本那样简单地从硬盘中捞出你需要的歌曲文件,更别提照片和视频文件了。
据说Google正在研究多媒体搜索方面的技术,他们目前也有一个图像搜索功能,但是那是根据网页上的文字判断其相关性的,纯粹的多媒体数据搜索我还没有看到成功的产品。我不禁开始幻想,在这个领域会不会成为一个新的爆发百万富翁的热点。