見出し画像

バイオインフォマティクスの資格を取るためにメモしまくる件について 計算科学編(マークアップ言語によるデータ記述)

マークアップ言語
XML


マークアップ言語
┣ HTML (hyper text markup language)
┗ PXML (exten-sible markup language)
etc

・文字の並びであるテキストに適応な指示を挿入して文字の形や大きさ、段落、見出しなど文章の構造と体裁を指定するためのコンピュータ用言語。
・特徴は文書の書式を変更したい始めに <  >,終わりに</  > とタグ(標識)をつけている

画像1

・例として、HTML文書の <b> 文字列を太字で表示
・<p>Hello <b>Markup</b></p>、<p>Language!</p>
・文書の構造(見出しや段落)も指定も可
・ただし、HTML では HTML で定義されたタグしか使用することができない

XML
・SGML(standard generalized markup lan-guage)とよばれる文書標準化のためのマークアップ言語を簡略化した言語
・文書を作成する人がタグを自由に作成することが可能。Aの部分が自由に変更可<A>,</A>

Ex1.The Beatlesの3アルバムデータ
<?xml version="1.0" encoding="UTF-8" ?>
<album_list>
<album id="1">
        <title>HELP!</title>
        <artist>The Beatles</artist>
        <year>1965</year>
</album>
<album id="2">
        <タイトル>Let It Be</タイトル>
        <artist>The Beatles</artist>
        <year>1970</year>
</album>
<album id="3">
        <title>Hotel California</title> >
        <artist>Eagles</artist>
        <year>1976</year>
</album>
</album_list>

説明
・album、title、artist、year タグ= 要素
・album (=要素)「id="1"」=「属性」
・<A>、</A> 、Aの部分が要素。
・属性とは、要素に対して付加的な情報を付け加えるため

・DTD(document type definition) 書式とは…要素が自由に設定できるので、データを共有したい場合、XML 文書の構造を定義するための言語としてDTDを使用する。
Ex2.DTD
<! album_list
<! ELEMENT album_list (album)>
<!ELEMENT album (title, artist, year)>
<! ELEMENT title (#CDATA)>
<! ELEMENT artist (#CDATA)>
<! ELEMENT year (#CDATA)>
]>

<?xml version="1.0" encoding="UTF-8" ?>
<album_list>
<album title="HELP!" artist="The Beatles" year="1965" />
<album title="Let It Be" artist="The Beatles" year="1970" />
<album title="Hotel California" artist="Eagles" year="1976" />
</album_list>

・XML は多くの生物学データベースを記述するために利用されている。たとえば、タンパク質などの立体構造のデータベースであるPDB。

この記事が気に入ったらサポートをしてみませんか?