書籍-LINK.com [05/27update]

▼最新情報をCheck!!▼


「文字符号化方式」||書籍-LINK.com [05/27update]

文字符号化方式 wikipedia|無料辞書

前のページ 1/2 次のページ
文字符号化方式(もじふごうかほうしき、character encoding scheme、CES)とは、符号化文字集合文字に対応付けた非負整数値を、実際にコンピュータが利用できるデータ列(通常、バイト列)に変換する符号化方式
文字符号化体系文字符号化スキームとも訳す。英語ではcharacter coding scheme (CCS) とも言う(訳は同じ)。文字について述べていることが明確なときは、単に符号化方式、またIBMの用語ではコード化体系 などとも言う。
この用語はUnicodeIETF標準などで用いているが、ISO/IECJISの標準では用いず「符号化文字集合の構造」あるいは「文字符号の構造及び拡張法」として扱われている。この用語の定義は、世界の文字コード規格とは必ずしも合致しないことがある。

◆符号化文字集合と文字符号化方式
符号化文字集合とCESの関係を示すため、JIS X 0208を例にとる。なお、話を簡単にするため、附属書は無視する。
JIS X 0208は、符号化文字集合であり、文字の表と、各文字に対応付けられた1区1点〜94区94点の番号(区点)と、それに対応したビット組合せからなる。例えば、「亜」という漢字の区点番号は16区1点であり、対応するビット組合せは x0110000 x0100001 の2バイトである (xは呼出し先がGLであれば0、GRであれば1)。こうした符号化文字集合について、他の符号化文字集合と組み合わせたり、計算によって変形したりする方式を、文字符号化方式 (CES) と呼ぶことがある。また、特定の符号化文字集合とCESとの組み合わせによって実現する文字列の表現を符号化表現と呼ぶことがある (符号化表現はとほぼ同義である)。
1つの符号化文字集合に適用できるCESが複数ある場合、符号化表現も1つではない。JIS X 0208の場合、主要なものとして、ISO-2022-JP (RFC1468符号化表現)、EUC-JPShift_JISがある。
ISO-2022-JPは、JIS X 0208の文字に対応付けた1〜94の区点を、それぞれ2116〜7E16の範囲の1バイト、計2バイトで表す。さらに、エスケープ・シーケンスを使い、ASCIIJIS X 0201など別の文字集合に切り替えることができる。このように、1つのCESが使う符号化文字集合は、1つとは限らない。
ほとんどの場合、ISO-2022-JPのように符号化文字集合とバイト列の対応は単純であるが、常にそうだとは限らない。Shift_JISでは、JIS X 0208文字集合を、複雑な計算式により、2バイトで表現できる000016〜FFFF16のうちJIS X 0201と競合しない長方形の領域に詰め込んでいる。

◆文字符号化形式と文字符号化スキーム
Unicode標準では、文字符号化スキーム(、略語:CES)を、文字符号化形式[外部リンク] Unicode Terminology English - Japanese, C, Unicode, inc.(、略語:CEF)と、バイト直列化[外部リンク] Unicode Terminology English - Japanese, B, Unicode, inc.等の2つの段階に分けて標準化している。
Unicodeの符号化文字集合では、各文字にU+0000..U+10FFFFのUnicodeスカラ[外部リンク] Unicode Terminology English - Japanese, U, Unicode, inc.を対応付けている。CEFは、このUnicodeスカラ値を符号単位列に変換する。UnicodeのCEFには、UTF-8UTF-16UTF-32があり、これらが使う符号単位はそれぞれ、符号なし8ビット整数(ここで言う符号とは正負のこと)、符号なし16ビット整数、符号なし32ビット整数である。これらの文字符号化形式はプログラムにおける文字の内部表現として実装される。
しかし、情報交換のためファイルの読み書きや通信を行う場合には、符号単位列をバイト列にする必要があり、8ビット以外の符号単位列をバイト列にするには、バイト順序(エンディアン)を決める必要がある。そのためCESでは、CEFに加え、バイト直列化の手続きを決める、つまり、エンディアンを指定するかまたはエンディアンを記述する方法を規格化している。(各CESのバイト直列化の具体的な内容については、UTF-16#符号化スキームを参照)
Unicode標準で定められたCEFとCESは、表のものがある(ただし、Unicode技術標準[外部リンク] About Unicode Technical Reports - Types of Unicode Technical Reports: UTR, UTS, UAX, Unicode, Inc.SCSU (UTS 6) が、Unicode技術報告UTF-EBCDIC (UTR 16) とCESU-8 (UTR 26) が、Unicode技術ノート[外部リンク] About Unicode Technical Notes, Unicode, Inc.BOCU-1 (UTN 6) が、その他、ISO/IEC標準やRFCで、Unicode文字集合を使ったCEFやCESを規格化している)。同じ名称のCEFとCESがあり、これらを区別するときは、「UTF-16符号化形式」「UTF-16符号化スキーム」のように呼ぶ。一般にUTF-16と呼ばれるものは、UTF-16符号化形式に対応する3つのCESの総称である。なお、UTF-8符号化形式とUTF-8符号化スキームは実質的に同じものだが、便宜上、分けている。
Unicode以外でも、原理的にはCEFとCESを区別して論ずることができる。しかし、殆どの場合8ビット整数を符号単位とするため、UTF-8の場合と同様に区別する意味は少ない。たとえば、Shift_JISの文字データを扱うプログラムは、8ビット整数を符号単位とするマルチバイト文字の文字データの処理を行っているため、ファイルの読み書きや通信などでバイト直列化処理をあらためて行うことはない。

◆キャラクタセット
MIME ではキャラクタセット()という概念が用いられる。
キャラクタセットは「オクテットの並びを文字の並びに変換する方式」と定義されるFreed and Postel. 参考文献, ‘1.3. Charset’, p.1.。MIME で実現する電子メールメッセージなどの処理を主眼に置いた概念である。ネットワーク上の符号化表現をなんらかの文字の集合に写像するための変換方式が互いに異なれば、それらは互いに異なるキャラクタセットである。言い換えると、文字符号化方式と符号化文字集合とをまとめたものがキャラクタセットである。このため、一般にキャラクタセットでは、符号化表現と文字とが一対一に対応するとは限らない。
インターネット上で用いることのできるキャラクタセットの登録と公開は IANA が行っている(「外部リンク」参照)。

前のページ 1/2 次のページ
・文字符号化方式 page1
文字符号化方式 page2

文字符号化方式を他のサイトで調べる
@[文字符号化方式]暇つぶしマスター
A[文字符号化方式]性病マスター
B[文字符号化方式]ダイエットNAVI
C[文字符号化方式]価格比較マスター
D[文字符号化方式]肛門科マスター
E[文字符号化方式]産婦人科科マスター
F[文字符号化方式]結婚情報マスター


■書籍LINK関連検索

ケータイ小説
ハリーポッター
ゼロの使い魔
BL小説
ドリーム小説
ホームレス中学生
投稿 小説
ライトノベル
村上春樹
ラノベ
三島由紀夫
綿矢りさ
星新一
夢をかなえるゾウ
よしもとばなな
村上龍
村山由佳
団鬼六
筒井康隆
二次小説
くるねこ
室井佑月
石原慎太郎
川端康成
辻仁成
遠藤周作
江國香織
安部譲二
山田詠美
平野啓一郎
唯川恵
浅田次郎
田口ランディ
オススメ 小説
宮本輝
北方謙三
志茂田景樹
藤沢周平
三浦綾子
坂口安吾
田辺聖子
大江健三郎
田中康夫
五木寛之
安部公房
向田邦子
天璋院篤姫
小松左京
高橋源一郎
野坂昭如
井上靖
椎名誠
開高健
北杜夫
鷺沢萠
新井満
島田雅彦
菊池寛
吉行淳之介
宗田理
原田宗典
ランキング 小説
池澤夏樹
堀辰雄
佐藤賢一
高橋克彦
姫野カオルコ
立松和平
2ch 小説
中上健次
生島治郎
片岡義男
寺山修二
小田実
東京島
高橋三千綱
花田清輝
干刈あがた
松浦理英子
さまよう刃
うめつば
船戸与一
一覧 推理小説
一覧 時代小説
一覧 恋愛小説
一覧 官能小説
一覧 ホラー小説
一覧 ミステリー小説
短編集 人気作家
一覧 海外小説
通販 小説
ランキング ネット小説
ランキング ケータイ小説
芹沢光治良
平中悠一
松沢直樹
山川健一
明日の約束
明日もまた生きていこう
蟹工船改版
グロウバック
新宿退屈男

■書籍LINKWikipedia情報

小説
文学
日本文学
児童文学
短編小説
ショートショート
長編小説
芸術家小説
小説一覧
小説家
小説家一覧
オンライン小説
オンライン作家
小説投稿サイト
電子書籍
ケータイ小説
ライトノベル
サウンドノベル
ビジュアルノベル
大説

おすすめサイト

ダイエット

 美容・ダイエットならオマカセ!ダイエットNAVI

性病

 性病?お悩み・病院検索は性病マスター

暇つぶし

 いま、ヒマ?暇つぶしマスターで暇つぶし★

価格比較

 気になる商品の価格を比較!価格比較マスター

懸賞

 カンタン応募で豪華商品が当たる!アタックchance!

バイト

 駅チカバイトなら楽ラクバイト.com

求人

 地域を選んでバイト、仕事を探せる!!バリバリ仕事!.com

アルバイト

 バイトをこだわり条件で探す!こだわりキャリア.com

求人情報

 自分に合ったバイト探し★Myピッタリ仕事.com

バイト

 "資格"でバイト探し!天職さがそ!.com

バイト

 いいバイト、あるある!aruアルバイト.com

懸賞

 アタックchanceで懸賞チャレンジ!

産婦人科

 病院探し!病気相談なら産婦人科マスター

出産

 妊娠!出産!育児!赤ちゃんマスターでお悩み解決!

外為

 外為・為替レートをチェック!外為マスター

結婚

 結婚マスター!結納・両親・マリッジブルーノお悩みに…

先物

 先物・取引!詳しくなる!先物マスター

資格

 資格!キャリアアップ!資格GETマスター★

小説

 小説・書籍ならオマカセ!小説マスター

スポーツ

 スポーツ!健康!デトックス!スポーツマスターにオマカセ!

葬儀

 お葬式・葬祭のことなら・・・葬儀マスター

痩身

 ダイエット・デトックス・痩身!スリムGETマスター

脱毛

 パーフェクトBODY目指せ!脱毛マスター

着うた

 最新!人気!定番!うたマスターで着うたCHECK!

デコメ

 キラ系かわいいデコメCHECK!デコメマスター

転職

 履歴書・マナー・転職テク!就職情報なら転職マスター

バイク

 ハーレー!改造!バイクマスターにオマカセ!

派遣

 派遣!転職!キャリアアップ!転職マスター

ペット

 カワイイ犬・猫を飼いたい!ペットマスター

豊胸

 薄着の季節…お悩み解決!豊胸マスター

包茎

 包茎のお悩みなら…包茎マスター

レシピ

 今晩のおかず…料理・レシピならレシピマスター

モバグラMIXの人気キーワード

 モバグラMIXの人気キーワード一覧

外為

 外為情報をいち早く!外為LINK

求人

 転職・就活なら求人LINKにオマカセ!

金融

 金融業界の勉強するなら!金融LINK



 TOYOTA!HONDA!BMW!車のコトなら車LINK

モバグラMIXの人気キーワード2

 モバグラmixの人気キーワード2

  ■モバグラMXIの人気キーワード3

 モバグラMIXの人気キーワード3

  ■モバグラMIXの人気キーワード4

 モバグラMIXの人気キーワード4

  ■モバグラMIXの人気キーワード5

 モバグラMIXの人気キーワード5

  ■モバグラMIXの人気キーワード6

 モバグラMIXの人気キーワード6

  ■モバグラMIXの人気キーワード7

 モバグラMIXの人気キーワード7

  ■モバグラMIXの人気キーワード8

 モバグラMIXの人気キーワード8

  ■モバグラMIXの人気キーワード9

 モバグラMIXの人気キーワード9

  ■モバグラMIXの人気キーワード10

 モバグラMIXの人気キーワード10

  ■モバグラMIXの人気キーワード11

 モバグラMIXの人気キーワード11

  ■モバグラMIXの人気キーワード12

 モバグラMIXの人気キーワード12

モバグラMIXの人気キーワード13

 モバグラMIXの人気キーワード13

  ■モバグラMIXの人気キーワード14

 モバグラMIXの人気キーワード14

  ■モバグラMIXの人気キーワード15

 モバグラMIXの人気キーワード15

  ■モバグラMIXの人気キーワード16

 モバグラMIXの人気キーワード16

  ■モバグラMIXの人気キーワード17

 モバグラMIXの人気キーワード17

車査定

 車査定.com

献立レシピ1

 レシピが月額99円

献立レシピ2

 レシピが月額99円



~書籍-LINK.com [05/27update] トップへ
(C)書籍-LINK.com

モバイルSEO