golden-luckyの日記

ツイッターより長くなるやつ

自分で買った本を読んでいて謎の日本語や組版の不備や構成の甘さに耐えがたくなったり、発売前に長大な正誤表が出るといった話を聞いてしまったりすると、自分の仕事でどこまで手を抜いても売上や信用を落とさずに乗り切れるか、という思考実験がついつい脳の片隅によぎってしまう。

段落のチューニングとかは不要な作業に違いない。非文が残ってたり、やけに受動態が多かったり、同じことを何回も書いてあったり、実際にそういう本はままあるし、そういうところから手をぬけそう。未定義な用語を雰囲気で使っていても評価されてる本はあるし、文脈で察しがついて読めればいいはず。ようは内容なので、著者に価値ある情報を文章化してもらって製作プロダクションに組版してもらえば本になって売れる。誤字とか日本語の不統一とかは内容に明るくなくても目立つ点なので、まあ直したほうがよいのかな。それにしたって、がんばったところで売れゆきには大きく関係しなさそう。となると、著者を見つけてタイトルを決めて原稿を集めれば、事実上は仕事が終わったことになる。

この思考実験、実施してみる機会がない。

立ち上げのころからよく知っている電子書籍の出版社直販サイトが昨日で販売を中止し、ハードDRMがかかっていないPDFが主な商品だったので購入済みの本が読めなくなるということは原則としてないんだけど、しばらくしたら購入済みの本のダウンロードもできなくなるので、保存していたハードディスクが飛ぶなどしてバックアップもなけば事実上再入手は困難になる。

このような状況になること自体は、同じような出版社直販サイトをやっている人間として言うべきことでないのは承知のうえだけど、ある程度は仕方がないことだと考えている。というか、そうした事業継続が困難になるリスクをゼロにしようとしていたら、何も始められない。ぶっこんで本を作って売っているので買ってください、と言い続けるだけである。買ってください。

www.lambdanote.com

で、こういう話があってもなくても常に考えてる問題として、完全に平のデータをダウンロードできる電子書籍販売サービスとするか、それともハードにせよソフトにせよ何らかのDRMを設定するかという話がある。ラムダノートでは、FAQにもあるように、PDFの各ページに購入ごとに一意なIDを挿入している。メールアドレスのような第三者が個人を識別できるプライバシー情報ではなく、購入時に生成しているハッシュデータで、社内からだけは逆引きができる。幸い、したことはない。本を読むじゃまにならないよう、リーダーでは不可視にしているので、あえて文字列選択とかしないと見えない。このようなソフトDRMの仕組みをいれることにした背景は2つあって、1つには海外の版権を買うときに「なんらかの電子的な流出防止策を講じること」という条項が含まれるケースで過去に苦労したというのと、もう1つは、そうした仕組みを用意しないで済ませることで、「自分たちは出版社として権利が設定された商品を書いてもらい、それを販売している」という意識が弱まっていくのが怖かったから。何事も、実装や運用を楽にするのって、自分たちの仕事に対する意識を弱めた結果であるとしたら、あとは落ちる一方だなという気がしている。

これって、最近の仮想通貨取引所とかの話に近いものがあるかもしれないなあとも思う(技術的にはよほど単純な話だけど)。そう考えると、単方向ハッシュ文字列をページに入れるんじゃなく、ブロックチェーンを応用すれば、完全に個人のものになる権利保護ありの電子商品購入という体験をプライバシーの問題を引き起こさずに提供できるはずだという方向に妄想が広がる。すでにそういう技術開発をしているところはあるっぽいので、妄想じゃないな。弊社のいまの体力を考えれば妄想だけど。

妄想ついでに、完全に個人のものになる権利保護ありの電子商品を販売するのが「出版の未来」なのかという疑問に対して出版社としてどう取り組むべきかが年々わからなくなるという話があって、実際、O'Reilly Mediaは、完全にそういう「出版の未来」を見捨ててしまった。代わりに彼らがやっている会員制の電子図書館は、個人的にはとても魅力的なサービスなんだけど、このまま日本でも商売になるかは微妙な気がしている。年4万円は、やっぱり個人向けにはかなり敷居が高い。すべての電子書籍は、ブラウザの画面ではなくKindle Oasisで読みたい。そんなふうに個人的な要求から整理していくと、とてもいまあるパーツを組み合わせて正解を出せるような気がしないのでした。

理工書のタイトルに「入門」が多いのは出版社の編集者が売れるからという理由で入門でないものにも入門とつけたがるからだ、という頻出の話題をまた見かけたので、当事者を対象としてツイッターでアンケートしてみた。

125票って、最後の選択肢の37%を割り引いても当事者以外の思惑がかなり紛れているような気がするけど、それでも「売れるようにするため」という選択肢がこんなに多いとは思わなかったよ。。

ぼく自身はわりとタイトルに「入門」ってつけるのを躊躇しないほうだけど、素朴に「実践的な話とか応用例には踏み込んでない、あくまでも入門です」を示す記号として捉えている場合がほとんどだった。そのような場合に、書名であることが認識しやすいパターンとして、「~入門」や「入門~」を採用することが多かった。それだけで「売れる」と考えたことはまったくなく、むしろ正直なところ『型システム入門』に対する「編集者による入門詐欺」という風説をみてはじめて、そういうふうに見えるものなのかーと思ったくらい。入門というタイトルなので簡単なはずという誤認の可能性に思い至らなかったともいえるので、日本語を扱う仕事についている身としては残念です。

にしても、このアンケートの結果で真に驚いてるのは、いわゆる入門詐欺を本気でやっている編集者もゼロではなさそう、という点なんだよな。世の中そんなに甘くないだろうって思うんですが、入門ってタイトルにつけるだけで売れる(少なくともその可能性が高まる)ほど単純な商売なんでしょうか?

こうなると、もう、実践とか応用に踏み込まない本に「入門」というタイトルをつけるのが憚られてしまう。どうすればいいのだろう。基礎でも同じに思えるし、現代日本語における入門という語の幅広いニュアンスから簡単とか誰でもわかる的な要素を取り除いた新しい用語の発明、もしくは入門という語の再定義が求められる。

マークアップ言語における記法とは何かって、確かに定義が必要だった。

ここで取り沙汰されている記事を書いてるときは、「構造およびレイアウトの指定に使うメタ情報」、もしくは、それだけだとWordのスタイルとかも「記法」になってしまうので、「テキストベースの文書データで文書の構造およびレイアウトの指定などに使うメタ情報のシンタックス」だと思ってもらえることを期待してたんだけど、これって実際のところ、ぜんぜん自明じゃないな。

コンピュータを使うにせよ使わないにせよ、印刷して人にみせられる文書を著す場合、そのための版を作るという作業が必要になる。 「印刷して人にみせられる文書」の定義は、現代では非常にめんどくさいので、このへんは適当に解釈してください。たとえば、ブラウザでのレンダリングであっても用語は違うけど同じことです。

で、文書というものは、いろんな役割の部分から構成されている。たとえば、本文段落というのも、そのような役割のひとつ。もちろん、見出しとかもそう。

紙に人間が手書きした状態を読むときは、そうした文書の各部の役割を、読み手が誤読しない規範的な見せ方として書き手自身でハードコードする必要がある。 小学校で「段落の先頭は一文字開けましょう」とか習うのは、これ。 行頭一字下げというのは、和文における伝統的な段落組版ではない。和文における伝統的な段落のためのハードコード方法ならいえる(江戸しぐさが日本の伝統である的な意味で)。

というわけで、手で文書を著すときは、紙にどんな文字をどんな見た目で配置すれば文書の各部の役割を誤解なく読み手に解釈してもらえるか、っていうスキルを書き手が意識する必要がある。 しかし、少なくともグーテンベルクからこっち、書き手自身による見せ方の工夫として文書の各部の役割をハードコードするしかないという状況ではなくなった。 そのかわり、「文書のこの部分の役割は本文段落です」といった情報を文書そのものに付随して明示して、その付随された情報をもとに、誤解のない見せ方であったり魅力的な見せ方であったりを専門家が考慮できるようになり、さらにはコンピュータで解釈して一定の見え方を決定できたりするようになった。 この付随情報を示すルールのことを、もとの記事では「記法」と言ってます。

こう考えると、コンピュータで文書を書くときに「記法」が問題になるのは、常に印刷する前提で文書を書いてるから、という面もありそう(ここで印刷というのは、プリンタから紙を出すことだけじゃないです、念のため)。

ここで、本文段落という役割をもつ部分をコンピュータで書くときの「記法」について想いを馳せると、だいたいこんなのが主流になってると思う。

  1. 行頭から空行までの文字列
  2. 行頭から改行までの文字列
  3. <p>という記号列から、一定の規則を満たす状態まで
  4. <p>という記号列と</p>という記号列で挟まれた文字列

などなど。

1つめは、MarkdownとかTeXとかで広く採用されているおなじみのやつで、ふだんは記法だと意識してないかもしれないけど、記法です。 念のため注意しておくと、これは、欧文組版で行間スペースだけで段落としている場合がある、という事実とはまったく関係ない。 そういう組み方の例があるからこそ書き手の直観と一致する記法として広く採用されるに至った、みたいなストーリーがあったりするのかもしれないけど、知らない。

2つめは、テキストデータにおける1行を1つの本文段落とみなす記法で、DTP工程への指示として出版業界ではよく使われている。 この場合、空行は段落より大きな意味上の区切りを終端するための記法とみなされることが多い。 このように1行1本文段落の記法が使われているのは、DTPアプリケーションに流し込むときに空行があるとハード空行になってしまうから、という実務的な事情が大きいと思う。 行頭に全角スペースを入れたがる編集者もいるかもしれませんが、DTP工程では嫌がられてると思うので、やめようね。

3つめと4つめは、いうまでもなくHTMLですね。整形式でないHTMLをわざわざ別建ての項にしたのは、構造の話ではなくあくまでも記法の話だというのを強調するため。

ここまで考えて、ZRさんの疑問を基にしているsky_yさんのこの記事が、ZRさんの疑問とはちょっと違う話題になってしまっているな、と気づいた。

note.solarsolfa.net

ZRさんは、「複数の段落に役割を持たせ、そのための記法にハード空行を使っている文書」について考えていて、「そういう構造を利用して文書を書いている人が、ハード空行が段落区切りにしかならない一般的なMarkdown方言の処理系を使うと、戸惑いそう」という話をしてたんだとおもう。 それに対して、sky_yさんの記事は段落をハードコードする流儀の話になってしまっている。

このような話でこういう齟齬が生じてしまうのも、そこそこ直観に合致するハードコードで文書の役割を明示する記法であるところのMarkdownにとって避けられない暗黒面のひとつなのかもなあ。

note.mu

言いたいことは、すごくよくわかる。でも、残念ながら、「読まれるテキストとは、読み飛ばせるテキストである」というのが圧倒的に正しい。だから、「読まれるテキスト」を考えるなら、元記事のように、「読み飛ばせるテキストにするにはどうするか」っていうのをスタートにしたほうがいいとおもう。

読み飛ばせるテキスト、ぜんぜん悪いものじゃないよ。読み飛ばすような内容もないのが、悪いテキスト。ちなみに、内容がないけど読み飛ばせないテキストっていうのが最高ですね。

そもそも、段落をちゃんと構成しなきゃいけないのは「読み飛ばせる」ようにするためだ。そういう構成ができているテキストを読むっていうのは、情報を取り入れるための最速な手段だといえる。

「あ、これ、ちゃんと分かりたいし、ちゃんと読まないと絶対に分からないやつだ」という人は、読み飛ばしたあと、読みなおしてくれる。だから、そのときに困らないような丁寧な文章も、読み飛ばせる構造の中に用意しておく必要がある。文芸書や詩文なら話はべつだけど、おれらが一生懸命に文章を書いたり直したりしてるのは、そうやって気持ちよく読み飛ばしてもらい、それでもなお、だれかに話を聞いてもらうためなんだとおもってる。

blog.jnito.com

同書の制作の舞台裏がとてもよく伝わってくる、すばらしい記事だった。 すごくよくまとまっているので、未読だけど書籍本体もしっかり書かれているのだろうなと感じた。

で、制作の舞台裏があまりにも伝わりすぎたので、おれにもひとこと言わせてという気持ちが抑えられず、2点だけ突っ込ませてほしい。


まず、「紙の本の制作は完全にウォーターフォール」という文字列を見て、どうしようもなくアンビバレントな感傷に飲み込まれてしまった。 というのも、まさに「おれたちの紙の本づくりはウォーターフォールではない」という発表を、いまを遡ることちょうど10年前にしていたから。

www.slideshare.net

あれから10年間、それなりに商業的にも成功するタイトルをイテレーティブかつインクリメンタルに作ってきたつもりだし、ほかにもこういうスタイルの紙の本づくりを実践するところは出てきているし、なので、やはりこれは「紙の本」全般の話として受け取られたくないなという強い気持ちがある。

で、ソフトウェア開発においてウォーターフォールがぜったいダメでないように、紙の本もウォーターフォールではダメというわけではなくて、同書の制作で採用された従来型の制作方式でうまくまわす方法というのも当然ある。 それはもちろん、前工程への手戻りを最小化することで、紙の本づくりでいえば「とりあえず組んで赤字を入れよう」という甘えをDTPに回す前の原稿整理と推敲の工程で完全に殺すことなんだけど、まあ、そういう感じでストイックにウォーターフォールできてるところはあまりないんだよな……。 だから、ウォーターフォールの是非というより、DTPの人(編集の人じゃない)に泣いてもらうというソリューションの擬似スパイラルモデルが紙の本づくりの実体になっているというのが同記事から見えてきて、ちょっとうっていう気持ちになった。 完成する本が読者にとってよくなることを目指すのが制作では至上目標だし、組版された初校ゲラで推敲するのが現場では日常風景になってるけど、やっぱそれは悪いウォーターフォールなんで、ウォーターフォールするなら良いウォーターフォールを目指すべきだよなと思う。


もう1つアンビバレントなのは索引まわりの話で、索引って、著者がひくのが前提なのだっけ? というのは、べつに煽ってるわけじゃなくて、むかしむかし編集者として索引について記事を書いたときに「索引はできれば著者にも手伝ってもらおう」というような提案をしたら「編集者の仕事だろが」というツッコミを受けた経験があって、それでちょっと宇宙ネコになった。

note.golden-lucky.net

いや索引ってまじで編集作業そのものでもあるから、編集者もゲラにする前に項目ピックアップやったほうがいいよ。 索引項目のピックアップがいかに編集の精度向上に役立つかについては、また我田引水だけど、これにくわしい(前半は世界の索引紹介みたいな感じなんで、スライドは37枚目あたりからが本題っす)。

note.golden-lucky.net

古き良き雑誌とか新聞の、あのいろんな情報が平面全体をつかって構成されているレイアウトって、読み手に情報を「捨てさせる」うえで効果的なのかもしれないなあ。もちろん作ってる側は「見てほしい」部分を生かすように工夫してるには違いないんだけど、それってつまり消化しづらい部分を「読者がスルーしやすい状態」に追いやっていることでもあるわけで、だとすると、結果的に読み手は、消化しやすい情報ばかりを無意識に取り出してしまうことになる。見せたい部分をうまく見せる技術としての編集で、消化しづらい情報をかみ砕いて提供する技術としての編集を、代替しないようにしたい。