HTML文書の構造
概要
HTMLは文書の内容と構造を記述するための言語です。 HTMLの構造は重要な意味をもつため、構造について理解します。
- 文書の構造
- 構造とデザイン
- 現代のHTML
- HTMLの歴史
文書の構造
Webページに限らず文書には構造があります。 小説にも章や段落といった構造がありますし、新聞にもなんとか欄や見出しといった構造があります。
例えばWikipediaのHTMLの項は次のような見出し構造を持っています。
1 特徴 2 HTML文書 2.1 HTMLタグ 3 歴史 3.1 HTML 1.0、HTML+ 3.2 HTML 2.0 3.3 HTML 3.0、HTML 3.2 3.4 HTML 4.0、HTML 4.01 3.5 ISO/IEC 15445:2000 3.6 HTML5、HTML 5.1 3.7 HTML Living Standard 4 HTML形式の電子メール 5 脚注 6 関連項目 7 外部リンク
Webページ全体でみるとこれ以外にもヘッダやサイドバー、フッタといった構造があることがわかります。
現代のHTML
最近のWebページは以前とくらべてHTML文書の構造が重要視されています。 意味のある単位で仕様に沿って構造化されている必要があります。
なぜ最近になって重要視されているかというと、Webページをただ人間が閲覧するだけでなくコンピュータで自動的に処理することが多くなっているからです。 コンピュータは曖昧な文書を理解することはできないので、厳密に仕様に沿って文書が書かれている必要があります。 そのときにしっかりと構造化されていると、コンピュータはさらに詳細に文書の意味を知ることができます。
例えばGoogleの検索エンジンも文書の構造を考えてランキングしています。 そのため、HTML文書をしっかりと構造化することはSEOにもつながります。
構造とデザイン
以前はHTMLの構造がそこまで重要視されていなかったので、HTMLタグを使ってデザインするということが普通に行われていました。 例えばtable要素でページ全体のレイアウトがされていたりです。 これは本来のtable要素の使い方ではありません。 コンピュータはtableと理解しますが、それは間違って理解しているということになります。
このような背景から新しい規格のHTML5では、HTMLでは文書の内容と構造だけを記述することになっています。 デザインはHTMLではなくCSSで定義していくことになります。