2003/12/14

プロフィールの「使用言語」

_ 管理ページの [コントロールパネル]-[プロフィール] に [使用言語] という項目があります。 しかし、UTF-8 以外を選択してみても、残念ながらページには反映されないようです。 というわけで、念のためスタッフルームにも TB しておきますです。

_ ドキュメントらしいページが見当たらないので推測で弄っています。 なので、間違っているかもしれないのですけれど。 ココログのヘルプの「文字化けしたりアクセント記号が表示できないのはなぜ?」という項目には、次のようにあります。 これを見るに、「指定した場合を除く」というからには UTF-8 以外を指定できるに違いない、と。

ココログはUTF-8というテキストエンコーディングをすべてのページで使用します(別のエンコーディングを指定した場合を除く)。現在一般的に使われているほとんどのブラウザではUTF-8を検知して正しく表示することが可能ですし、ココログへの投稿も問題ないはずですが、もしウェブブラウザで使用するテキストエンコーディングを別のもの(Shift-JISなど)に限定している場合は、正しく表示することができません。

_ もしかして、プロフィールの設定なだけに、本人が話す言葉使うブラウザの、とかいう。 いや、まさか、そんな。
(^^;

_ ここで EUC-JP を指定できるならば。 もしかすると、IE でのココログル文字化け問題は回避できるかもしれません。

_ もう少し説明をしておきますと。 ココログルは accept-charset 属性で、フォームへの入力を EUC-JP で送信するよう要請しています。 しかし、IE は accept-charset 属性を解釈せず、常にリンク元のページと同じエンコーディング、即ち UTF-8 でリンク先に送っているのではないかと。 なので、リンク元のページを EUC-JP にしてしまえば、IE での文字化けが回避できそうな気がします。 気がする、というのは。 あたしが IE というか、IE が動くプラットフォームを使っていないため、確認できないという事なので。

_ あ、今後「使用言語」が反映されるようになったら。 XML 宣言 <?xml version="1.0" encoding="XXX" ?> と、/html/head/meta 要素のタグ <meta http-equiv="Content-Type" content="text/html; charset=XXX" /> (併せて、HTTP 応答の Content-Type: ヘッダも) がきちんと整合しているか、も。 確認を忘れないようにしておかないとね。

_ # 久しぶりの更新。でも、まだ本調子じゃないので、いましばらくは頻繁な更新は保留なのです。

| | コメント (2) | トラックバック (1)

2003/12/09

サブタイトル h2 解呪は RSS 呪縛を招く?

_ facet さんのサブタイトルのh2呪縛から逃げ出す? (facet-divers)という試み。 なかなか面白いですね。 しかし、それをやると生成される RDF データ腐ってしまう可能性も。

_ RDF データの description 要素の中は CDATA セクションになっているので、'<', '>' (が文字参照に変換された "&lt;", "&gt;") を含むテキストとして扱われます。 RSS 応用ソフトで、これがテキストとして扱われれば、即ち '<', '>' と文字参照の置換が正しく行なわれていれば、"</h2>ほげほげ<h2>" という中途半端なタグのようなものが表示されるだけです。 普通の XML の処理を考えると、このようになるのが自然だと思います。 見た目は良くありませんが、ここまでは問題はありません。

_ ですが、(X)HTML として解釈しようとする RSS 応用ソフトがいた場合。 h2 の終了タグが先頭にあり、h2 の開始タグが末尾にあるため、困った事になります。 RSS 周辺の事情が良く分かっていないので、杞憂なら良いのですけど。 とりあえず、ここは安全側に倒しておきたいところです。 第三者に悪影響を与えるのは避けたいですもの。
# そういう RSS 応用ソフトが悪いという気も ^^;

_ というわけで。 サブタイトルなどの RDF データに抽出される部分にタグを含める場合は、少なくとも開始タグと終了タグの対応がついているものだけにしておいた方が無難かな。 というのが、今のあたしの見解です。

_ 問題ない事が保証されるようなら、いずれあたしも使いたいので。 ご存じの方、ぜひぜひフォローくださいませ。

| | コメント (3) | トラックバック (4)

2003/12/08

XHTML 1.0 での属性値の注意点

_ # 検索フォームの導入へのコメントを引き継いでいます。

_ ココログのページは XHTML 1.0 Transitional になりますが、HTML 4.01 以前と異なる点が幾つか存在します。 例えば、誰にでも理解しやすい基本的な違いの一つに、要素名と属性名は全て小文字でなければならないというものがあります。

_ さて、大文字小文字の区別に関して意外と盲点なのが、列挙型の属性の値も全て小文字でなければならないという点。 列挙型の属性というはあらかじめ選択できる値が決まっているものの事で、良く目にするのは form 要素の method 属性の値 "get", "post" などです。 これは Second Edition で明記された項目であるため、XHTML 1.0 を使っている人からも見落とされがちかも知れません。

_ 余談ですが、EUC-JP, Shift_JIS, UTF-8 などの IANA で定義されている文字集合名は大文字小文字の区別はありません。 また、HTTP で要求を送る際に使われる GET, POST, HEAD などのメソッドは常に大文字である事が RFC2616 の 5.1.1 Method に規定されています。

| | コメント (0) | トラックバック (1)

2003/12/07

XHTML 1.0 妥当性を望む

_ ふと、The W3C MarkUp Validation ServiceAnother HTML-lint gateway で XHTML 1.0 Transitional への準拠度を調べてみました。 確認したのは、今までの全コンテンツが含まれているトップページ2003/12 のバックナンバーです。

_ ココログのバナーの a 要素に何故か alt 属性が付いているのを除いて、検証エラーなし。 これさえなければ、妥当なページになるのでちょっと残念です。 早く直してくださるよう、スタッフの皆さんに要望致します。 削るだけなのですから。

_ 一方、HTML-lint の方は、この記事を公開する直前では次の通り。 まずまずの結果です。 エラー (というより警告) も、こちらが手を出せない問題か、もしくはマイリストなどで問題ない範囲であえてやっている事ですから、とりあえずは妥協せざるをえません。 できれば、こちらも併せて改善して欲しいものです。

ページ エラー得点タグ種類タグ組数
トップページ 28 個90 点35 種類364 組
2003/12 月間 42 個88 点38 種類470 組

_ というわけで。 当面は "Valid XHTML 1.0! except for the banner of Cocolog" って事で一つ(謎)

x

| | コメント (1) | トラックバック (1)

«検索フォームの導入

検索