2009年6月19日 星期五

何謂 XML?它有何用途、目前有甚麼地方有使用到、以及它與HTML的差異性

因為本身專題主要是做將XML檔案的操作手冊轉換為HTML模式下給使用者觀看,所以當然就要對部分更加的熟西才行,所以就上網找了一些有相關的資料做整理,希望對以後做專題更有幫助。

可擴展置標語言(Extensible Markup Language,簡稱XML),又稱可擴展標記語言,是一種置標語言。置標指電腦所能理解的信息符號,通過此種標記,電腦之間可以處理包含各種信息的文章等。如何定義這些標記,既可以選擇國際通用的標記語言,比如HTML,也可以使用像XML這樣由相關人士自由決定的標記語言,這就是語言的可擴展性。XML是從標準通用置標語言(SGML)中簡化修改出來的。它主要用到的有可擴展置標語言、可擴展樣式語言(XSL)、XBRLXPath等。
歷史
XML是從1996年開始有其雛形,並向
W3C全球資訊網聯盟)提案,而在1998二月發佈為W3C的標準(XML1.0)。 XML的前身是SGML(The Standard Generalized Markup Language),是自IBM從1960年代就開始發展的 GML(Generalized Markup Language)標準化後的名稱。
GML的重要概念:
文件中能夠明確的將標示與內容分開
所有文件的標示使用方法均一致
1978年,
ANSI將GML加以整理規範,發佈成為SGML,1986年起為ISO所採用(ISO 8879),並且被廣泛地運用在各種大型的文件計劃中,但是SGML是一種非常嚴謹的文件描述法,導致過於龐大複雜(標準手冊就有500多頁),難以理解和學習,進而影響其推廣與應用。
同時W3C也發現到HTML的問題:
不能解決所有解釋資料的問題 - 像是影音檔或化學公式、音樂符號等其他形態的內容。
效能問題 - 需要下載整份文件,才能開始對文件做搜尋。
擴充性、彈性、易讀性均不佳。
為了解決以上問題,專家們使用SGML精簡製作,並依照HTML的發展經驗,產生出一套使用上規則嚴謹,但是簡單的描述資料語言:XML。 XML是在一個這樣的背景下誕生的——是不是能有一個更中立的方式,讓消費端自行決定要如何消化、呈現從服務端所提供的資訊?
XML被廣泛用來作為跨平臺之間交互數據的形式,主要針對數據的內容,通過不同的格式化描述手段(XSLT,CSS等)可以完成最終的形式表達(生成對應的HTML,PDF或者其他的文件格式)。

用途
豐富文件(Rich Documents)- 自定文件描述並使其更豐富
屬於文件為主的XML技術應用
標記是用來定義一份資料應該如何呈現
元數據(Metadata)- 描述其它文件或網路資訊
屬於資料為主的XML技術應用
標記是用來說明一份資料的意義
結構檔案(Configuration Files)- 描述軟體的結構參數

結構
每個XML文檔都由XML序言開始,在前面的代碼中的第一行便是XML序言,。這一行代碼會告訴解析器和瀏覽器,這個文件應該按照前面討論過的XML規則進行解析。第二行代碼,,則是文檔元素(document element),它是文件中最外面的標籤(我們認為元素(element)是起始標籤和結束標籤之間的內容)。所有其他的標籤必須包含在這個標籤之內來組成一個有效的XML文件。XML文件的第二行並不一定要包含文檔元素;如果有注釋或者其他內容,文檔元素可以遲些出現。
範例文件中的第三行代碼是注釋,你會發現它與HTML中使用的注釋風格是一樣的。這是XML從SGML中繼承的語法元素之一。
頁面再往下的一些地方,可以發現標籤里有一些特殊的語法。代碼用於表示無需進行解析的文本,允許諸如大於號和小於號之類的特殊字元包含在文本中,而無需擔心破壞XML的語法。文本必須出現在之間才能合適地避免被解析。這樣的文本稱為Character Data Section,簡稱CData Section。

沒有留言:

張貼留言