2.自描述數(shù)據(jù)
過去40年來的大多數(shù)計算機(jī)數(shù)據(jù)都丟失了,不是因為自然損害或是備份介質(zhì)的磨損,而只是因為沒有人來寫出如何讀取這些數(shù)據(jù)介質(zhì)和格式的文檔。在十年前的5.25英寸的軟盤上的Lotus
1-2-3文檔在今天的大多數(shù)公司內(nèi)都已經(jīng)讀不出來了。以不常用的格式保存的二進(jìn)制數(shù)據(jù),如Lotus Jazz
也許會永遠(yuǎn)地消失了。XML在基本水平上使用的是非常簡單的數(shù)據(jù)格式�?梢杂�100%的純ASCII文本來書寫,也可以用幾種其他定義好的格式來書寫。ASCII文本是幾乎不會“磨損”的。丟失一些字節(jié)甚至是相當(dāng)多的字節(jié),剩下的數(shù)據(jù)還是可以讀取的。這就與許多格式形成了鮮明的對比,如壓縮數(shù)據(jù)或是串行的Java對象,這些數(shù)據(jù)即使丟失一個字節(jié),剩余的數(shù)據(jù)也變得不可讀取了。