人工知能が音楽を創る デイヴィッド・コープ

人工知能が音楽を創る

人工知能が音楽を創る

 

 創造性の定義 

私の創造性の定義はデイヴィッド・ゲランターのそれと共通する部分がある。

……再構造化と創造性の核となる活動は、見かけ上無関係なアイデアうしの結びつけである。内省から出てきた独創性は、その問題と類推の見た目がかけ離れていることにこそ立脚している。もちろん、問題と類推の類似性はあるレベルでは存在しており、そうでなければ類推も存在しない。しかし、その類似性というのは深淵で、隠れていて、不明瞭で、間接的であることに相違なく、見た目の類似性があるがゆえに、互いに引き寄せ合う2つのアイデアのようなありふれたものではない。

 (略)

面白いことに、コンピュータは独創的な見た目を持つ出力を極めて容易に生成できる。(略)

[ランダム関数で]多くの場合は独創的な出力を効率的に生成する。すると、コンピュータは創造性を持てないと信じる人たちにとって、独創性は創造性の定義の範疇には含まれてはいけないことになってしまう。

(略)

芸術家にとって「派生物」ほど恥ずべき含意を持った言葉はない。どんな芸術も音楽作品も、他の芸術や音楽作品を〈引喩〉するという意味で、少なくともある程度は派生物ではあるが、一方で、ある作品は明らかに多過ぎる借用をしていて真に創造的だとは判断されないものもある。

(略)

マーガレット・ボーデンは、無から生み出される創造性という概念を否定している。(略)

ボーデンはこの「文脈における創造性」を大変重要視している。

 

もしある音楽家が何らかの奇跡により16世紀に無調の曲を作ったとすると、その曲は創造的と思われなかっただろう。その音楽作品や科学理論が創造的と評価されるためには、先行する作品や理論と何らかの結びつきがあって、それらとの関係の中で理解されることが必要である。(略)調性を理解している人だけが、シェーンベルクが調性を否定する中で成し遂げたことを理解できるのである。

 

(略)

私は創造性を「これまで積極的に結びつきを考えられていなかった2つ以上の多面的な物事・アイデア・現象どうしを初めて結びつけること」とした。この時、文脈の解釈はそれぞれ特定の事例を評価する人に任せている。

 私の創造性の定義の特徴は(初めて結びつけるのであって新しく発見することではないという意味で)相対的にアクティブであることと、(審美観ではなく)結びつけることに基づいていることである。また、私の定義では次の3つの概念が不要である。すなわち、意識(略)、面白い作品か面白くない作品か(略)、 独創性(ボーデンが指摘しているように、おそらく独創性という概念は存在しない。少なくとも基礎的なレベルにおいては)。私の創造性の定義ではさらに、発見が容易か困難か、美しいか醜いか価値があるか無価値かのような制約も不要である。評論家たちは、私の定義が創造の例として「混乱の創造」さえも許してしまうと主張するだろう。実際に多くの重要な芸術家たちは、「これまで積極的に結びつきを考えられていなかった2つ以上の多面的な物事・アイデア・現象どうしを初めて結びつけること」を推し進めながら、まさにこの方法で創作をしてきたのである。

(略)

 ここで定義したような創造性をさらに発展させる3つの方策を紹介しよう。まず最も重要なのは、創造を引き起こすためには、前提を無視するか少なくともその瞬間は後回しにするということである。次に、創造性を発揮するには、一見辻褄の合わないように見える概念どうしを、もしかしたら豊かな発想につながるかもしれない再検討を加えながら、結びつけたりその結びつきを変更したりすることである。最後は、本書で述べているような創造性は行きつ戻りつの非線形な思考を含むということである。これは、行き止まりを避ける能力であり、あるいは問題に対する潜在的な答えを敢えて曖昧にする能力である。

 新しい音楽とは

音楽における独創性について、アルノルト・シェーンベルクはこう述べている。

 

新しい音楽とは何なのか?

 明らかにそれはあくまでも音楽であることには変りはないが、それ以前に作曲された音楽とはあらゆる要素において異なっている音楽であるに違いない。それはこれまでの音楽においてはまだ表現されたことのないものを表現するものであるに違いない。いうまでもなく、より高度の芸術にあっては、今まで決して表出されたことがないもののみが表出される価値があるのだ。

(略)

すぐれた人達の手になるあらゆる傑作の中に、我々はかの不滅の新しさを発見するのである。

何故なら、芸術とは新しい芸術のことだからである。

 

 私は、ここでシェーンベルクが参照している「新しさ」というのは、既に存在している音楽の新しい組織化のことだと思っている。既に存在している他の音楽作品中たとえ数個の音や短いフレーズであっても、シェーンベルクが〈引喩〉している新しい「メッセージ」は、古いメッセージを実際に組み立て直したものに似ているだろう。

ミニマリズム

絶滅危惧種》で表現した複雑なミニマリズムは多くの聴者に、ある種の3段階から成る適応過程という面白い効果を及ぼした。多くの聴者は、最初この音楽を面白くて色彩に溢れていると感じる。しかし少し経つと、音楽がそれほど変化していないことに気づいて、単調という感情が湧き出す。なぜなら、聴衆の多くは物語的な音楽の構造(略)に慣らされているからである。弛緩したり期待が弱められたりすると、その後、聴者は音楽を違うように聴き始める。今聴いているサウンドの鍵を開けて、音楽のより極小なレベルで重要な変化が生じていることを認識し始める。聴者は一度この第3段階に到達すると、私が見るところでは、もっと自然な方法で音楽に順応していき、常に新鮮に音楽を聴けるようになるのである。

数式と創造性の起源

ブノワ・マンデルブロは、フラクタル生成における科学的な創造性つまり自己複製する数学的プロセスについて以下のように語っている。

 

ユークリッド幾何学の世界を愛していたおかげで(略)精巧なコンピュータのおかげで(略)極端に単純で真にミニマルな作品を生成する新しい方法を発見することが、私の大きな特権となっている。これらの作品は、数式に現れるパラメータを変更するという予測可能な方法で作り変えることができた。(略)これらの作品は「芸術」なのだろうか。(略)

単純な1行の数式から作られたこの新しいフラクタル画像の世界観からすれば、芸術家の目と想像力を駆使してフラクタル画像を芸術として観る人々と、ハイアートとの関係性は変化せざるを得ないのである。

 

私は自著『アルゴリズム作曲家』の中で、そのような数式が創造性の源泉としていかに重要かについて言及している。
イノベーションはたしかに1つの源泉であるが、それだけでは私が考える創造性の核には成り得ない。推論に同じく、創造性は規則に従っており、しかし、その規則は広範にあるいは曖昧に適用されるものである。このような緩い解釈や曖昧さが、知性的かつ創造的な振る舞いが持つ重要な基本性質の1つを表しているように思う。その緩い解釈や曖昧さは、規則として変更できないよう関連づけられている面と錯覚のような面も併せ持つプロセスを何度も繰り返すことで、理解されるに違いない。

 本物の創造性

本物の創造性とは、興味あるものを探す鋭い感覚を持ち、そのものを再帰的に追い求め、その感覚をメタレベルにも適応し、感覚に従って変化させていくことからなる。

 創造的でないプロセスもたらす感動

それゆえ、読者ががっかりすることを覚悟の上で、創造性はプロセスであって、プロセスの結果ではないという私の主張を繰り返そう。人は、創作物に触れると、驚いたり、衝撃を受けたり、迫られるような感情を持つ。しかし、創造的でないプロセスで作られたものにも同様に、驚いたり、衝撃を受けたり、迫られるような感情を抱く。図2.1 の音楽は、面白くて整った形をしているだけでなく、さらに独創的で驚くほど優れていると感じる一方で、創造的なプロセスの結果ではないとも感じる。後の章で示すように、人は創造性をいつも聴き取れるとは限らないが、作曲のプロセスに注意を払うと、創造性の存在を感じとれる。

 創造性を発揮すると称するプログラムはたくさんあるが、その出力はこの主張を裏付けていない。対照的に、それ以外のプログラムの中に、創造性に言及することなく創造的な結果を生み出しているようにも思えるものがある

(略)

 第1章で触れたハロルド・コーエンの Aaron は、アルゴリズム・コンピュータアートの歴史に金字塔を打ち立てた。Aaron が生成する絢爛で華麗な絵画にはしばしば 5000ドル以上の値が付き、その多くは収集家の興味を引く逸品として扱われている(略)。このような成功にもかかわらず、Aaron はアートを創造しているとは言えない。Aaron のプログラムは、多様性と予想を裏切る動作を生成するためのランダム関数を用いて、プログラマであるコーエンが与えたルールに従っているだけである。実際、Aaron が創造的ではないことが、人々の心を惹き付ける魅力の1つになっていることがわかる。Aaron はクリエータであるコーエンのためのツール、あるいはインターフェースなのである(略)。

 創作に関する疑問を投げかける執筆支援プログラムには RacterとHalがある。Racterは、1984年(興味深い年である)に書かれた『警察官のアゴ髭は半分だけ出来上がっている』の著者である。Racterは、コンピュータがランダムに選択する大量の異なるデータを、どちらかというと素朴なルールに従って管理していた。このプロセスは、古典的とも言える ELIZA を改良・拡張したものである。ELIZA は、蓄えられた文章と置き換えるべき単語を用いて単純な返答を生成するプログラムであるが、以下のような驚くほど素晴らしい散文を生成することもできる。

 

どんな時でも、愛と終わりなき痛みと永遠の喜びについての私自身のエッセイと論文は、この文章を読み、心配な友人や興奮した敵に向かって語り歌い詠唱する人々全員に理解してもらえると思っています。愛は謎でありこのエッセイの主題なのです。

 

(略)

コロンビア・ニュースブラスタは、 13 のニュースソース (CNN・ロイター・ABC ニュース・USA トゥデイなど)からのニュース記事を吟味し、その事件に関して正確なストーリーを生成するオンラインの実験的な執筆支援プログラムである。(略)

要約の中で用いられる文を単に取り出してくるだけではなく、自身の判断に基づいて、異なる事実間の重要性を解釈する。一般にニュースブラスタは、事実を脚色することも独自ストーリーを織りむこともない。それゆえ、どんなに出力が信頼できそうであっても、創造性をモデル化しているのではなく、むしろ創造性を避けているといった方が適切である。

 ランダム性が人の認識にもたらす混乱

創造性に関するほとんどの研究は、ランダム性が人の認識にもたらす混乱を見過ごしている。ある問題に対する創造的な解を、同じ問題に対するランダムな解と区別することが簡単なはずであり、それは事実、科学的な研究では容易である。その一方で特に芸術分野では、ランダム出力は少なくとも新規性や意外さに関して創造性と競合することが多い。創造性を模倣するためにコンピュータプログラムを用いると、さらなる混乱を招く。なぜなら、コンピュータはデータをとても素早く正確に処理できるので、その出力は人にとっては魔法のように見えてしまうからである。実際コンピュータが誕生するより前では、ランダムな振る舞いと創造的な振る舞いは明らかに異なっていたので、創造性とランダム性の違いにはあまり関心が向いていなかった。創作できると称するコンピュータプログラムのほとんどは、何らかの意味でランダム性を使っている。したがって我々が体験していることが創造性の結果なのか、単なる無闇な「ランダム性」の結果なのかを判定するために、ランダム性という用語を明確に定義することがとても重要になる。

(略)

 多くの人が、ほとんどの場合、何が起きているのかを理解するには条件が複雑過ぎるという程度の意味で「ランダム」の語を用いている。

(略)

それ以外の共通解釈として、パターンの欠如が挙げられる。

(略)

コンピュータのランダム性は実際には決定的である(計算機内部のある状態に対して、ある入力があった場合、一通りの決まった状態遷移をする)。(略)

プログラマプログラミング言語のランダム関数を呼び出す時はいつも、ランダム性を生み出すために選んだ初期値が、あらゆるものから無関係であることを頼りにしているのである。十分な時間があって生成のアルゴリズムも明らかであれば、プログラマは、コンピュータの疑似ランダム性によって生成される各データを正確に予測できる。

 上で述べた複雑性・パターンの欠如、無関係という3つの側面において、見かけのランダム性が生じるのは、決定性が不足しているからではなく、それを知覚する論理が不足しているからなのだ。

 創造性のモデル化

[コンピュータが]真に創造的であると認めるためには、コンピュータプログラムがそのプログラムを書いたプログラマとユーザーから十分に独立していなければならない。創造的に見えるアルゴリズム作曲プログラムのほとんどは、ユーザーが嗜好的な選択をするようなたくさんの出力を生成するものか、あるいはプログラマが定義した大量のルールを起動してそのプログラマが創造的であることを証明するものである。それゆえ、私がここで議論したいずれのプログラムも、創造性を実際にモデル化していない。

(略)

では、創造性やその欠如を発見するためにコンピュータプログラムから生み出される楽曲の中に、厳密には何を探し求めているのだろうか。この点において、私はストラヴィンスキーがとても雄弁に語ったこの言葉をよく引用する。

 

……多様性は四方八方から私を取り囲む。私はいつも多様性に直面しているので、多様性が欠けるのではないかと怖がる必要はない。対照・対比・反対はどこにでもある。だから類似性だけに注意しておけば大丈夫である。類似性は隠れているが、それは見つけ出さなければならない。あらゆる手を尽くして探し出した後にのみ類似性は見つかる。多様性にそそのかされても、私は多様性がもたらす安易な解に不安を覚えることはない。一方、類似性はもっと困難な問題をもたらすだけでなく、もっと確実で、従ってより私にとって価値のある結果をもたらす。

 

 類似性が創造性を同定するのに役立つとしたら、 類似性は制約を要求するので、制約を用いることも創造性の同定に役立つだろう。翻って、制約は問題を引き起こし、しばしば問題は創造性のみがもたらすことのできる新たな解を要求する。ストラヴィンスキーはこの点について次のようにコメントしている。

 

私にとって自由とは、依頼された仕事の1つ1つに対して自分自身に割り当てられた狭い枠組みの中で動き回ることである。すると私はもっと遠くへ行ける。自分の活動範囲を狭めれば狭めるほど、自分が障害物に囲まれれば囲まれるほど、私の自由はより偉大に、より意義深くなる。制約を減らすもの全ては強さを減らすものである。制約を課せば課すほど、魂を縛り付けている鎖から自分自身をまます解き放つことになる。

 

 制約を課さないとしたら、全ての選択は他の選択肢と同じ価値しか持ち得ない。等しい価値どうしの選択には、何の創造性も要らない。それは、単なる優れた疑似ランダム数生成器に等しい。

 

 人間が音楽をどう創るかを理解することは、ちょうどここで議論しているようなプログラムに足りないものを明らかにすることに通じる。たとえば、人間の作曲家はそれぞれ違う方法で仕事をする。多くの作曲家は精力的に多数のスケッチを書くが、一方で、少なくとも紙の上には全くスケッチせずに最終版の楽譜を仕上げていく作曲家もいる。ある作曲家は先頭から最後の順で作曲を進めるが、別の作曲家はより重要な部分から先に作曲し、後からその間を埋めていく。

(略)

 しかし、様々な創造的プロセスをコンピュータプログラムとしてモデル化する試みは、先が見えないものであろう。なぜなら、 そのプログラムがどんなに全てを含むようなものであっても、まだモデル化が行われていない創造的プロセスが多く残っているに違いないからである。さらに悪いことに、選ばれた創造的プロセスどうしは、互いに矛盾しているかもしれない。それゆえ、本書において創造性のモデル化を進めていくうちに明らかになるように、私は、ある1つのアプローチを採用する。それはユーザーとシステムが相互作用することである。この相互作用は、少なくともある意味で、人が創造性を発揮する時の多様性を説明するだろうと期待している。この相互作用は、たとえば音楽的なスケッチにとてもよく似ている。

プログラムによる音楽が人間の創造性をサポートする 

 たとえば、私のプログラムの音楽は本当の作曲でないとか、創造的プロセスに光を当てていないなどと批判されている。明らかに多くの批評家たちは私の仕事が何でないか知っていると思っている。しかし、ほとんどの人は何であるかを知らないようだ。批評家たちが人間の作った曲、特に歴史的な様式の音楽を美学的に評価する時、恒常的に用いることばは型にはまった狭い意味に定義されている。したがって、コンピュータが作った音楽を評価するために用いるのは、不可能ではないにしても困難である。しかしながら多くの聴衆は、その音楽がコンピュータ作曲と知らなければ、感情が深く反応するのを経験するはずである。そしてほとんどの人は深い疑問は抱かない。「皮肉なことにコンピュータプログラムは時々モーツァルトと同じくらい崇高な曲を作るが、そのコンピュータ自身は天才の手になる作品か単なるエレベータ内BGMか区別できない」。しかしながら「天才の作品」と「エレベータ一内BGM」を区別することは、量的基準を設けてできるようなことではない。「区別をする」ことは多分に主観的なプロセスであり、コンピュータプログラムの全ての出力に深淵な疑問を投げかける理由にはなっていない。

(略)

 EMI は、単に私に時間と気力があるなら手で書くであろう曲を作曲しているだけである。EMI の作品が1000曲以上公開されたという事実は、私が自分の著作の中で主張してきたとおり、作曲のリバースエンジニアリングが可能であることを証明している。私がバッハに似たコラールを作曲した時は、これらの作曲原理に基づき手で作ってみたのだが、プログラムによって同じタスクを行うより、8万倍も長い時間を要した。(私は 5.5 時間を要したが、コンピュータでは 0.25 秒である)。(略)

私のプログラムは大まかに私が200年以上(寝ずに)かかる作品を創作したのである。機械よ、ありがとう!

 EMI による私の作品を批判する他の評論家は、この音楽が人間の創造性を危機に陥れるという。私は逆に、プログラムによる音楽が、人間の創造性を実際にサポートするのだと思う。人間が、プログラムを走らせるためにコンピュータと設計し、製作したのである。人間が音楽を制作するコードを書いたのである。人間が、コンピュータが利用するデータベースの中身の音楽を書いたのである。そして、多分より重要なのは、人間が、出力結果を聞き評価することである。しかし依然、これらの事実は、機械に置き換わることへの深い恐怖心に紛れてしまっているのである。

(略)

これらの聴者はデータベース中にある音楽への引用や言い換えのために聞くのである。もし原曲を〈引喩〉するものがあると、これら聴者は、作曲プロセスは新しい曲を作るのではなく、模倣を作っているのだと主張する。ところが(第5章で示したとおり)作曲家たちは何百年にもわたって、自分たちやあるいは他の人の作品でも意識的・無意識的に引用をしているのである。

 ジム・エイキンのEMIに対する数多くの批判はこの種のものに属する。

(略)

私は最初コープの偉業に熱意をもって飛びついたが、すぐに悪寒を催すような、苛立ちを覚えるような不満へと変わった。テープ中にある曲はモーツァルト風であるのが認識され、そこには何の疑問もない。フレーズの特徴ある変化は和声構造がわかるように組み立てられ、音型を変化させ、適当なバスの旋律とカデンツが正しく現れている。問題はそれが質の悪いモーツァルトであることである。ここに優秀な音楽学者がいて(コープのこと)、彼は同時にコンピュータのプログラマであり、疑いもなく聡明で真摯な感受性を持った人物である。しかし彼は10年もの時間を質の悪いモーツァルトを作ることに費やしているのだ。それがどんなに凝ったものかは知ったことではないが、問題は、とにかくコンピュータプログラムが理論的に質の良いモーツァルトを作ることができるかなのだ。私は Noであると主張する。

 

 この最後の記述は、エイキンがプログラムの出力を実際に聞く前からそのものを決めているような人間であることを強く示唆している。

 何人かの批評家は EMI の出力を聞いて、それ以前に聞いたコンピュータ作曲の音楽と比較して、判断基準を再定義する。他の批評家たちは作曲中のプロセスを聞き、解析上のミスを逃さない。多くの他の聴者たちはそもそも音楽の聴き方を知らない。ほとんどの人が音楽を単に音楽そのものとして聞いて、新しい音楽が知られた様式で書かれているのを評価しようとはしない。(略)

彼らの耳と心は既に閉ざされているのである。

 『アルゴリズム作曲家』の中で、私はステファン・スモリアーの議論、すなわち EMI は人間の演奏家によって演奏されるからこそ聞かれるのだという発言を引用した。この言により、私は EMI の最初の商業レコーディングをMIDIコントロールのディスクラヴィーアで録音した。演奏家の容喙を避け、プログラムが作曲したものを正確に再現するためである。ジェイソン・ヴァントムはこの機械演奏に批判的で、それは人間の表情を欠くと言った。これら2つの見方により、EMI はライヴで演奏された時、成功は演奏者のものとなり、機械的に演奏された時には成功はなかった。いずれにせよ、評論家の視点に立てば、プログラムの出力は失敗作だったのである。

 ダグラス・ホフスタッターはEMIを不承不承認めた上で次のように言っている。「このプログラムはいかなる生命体も経験していないモデルに基づき、それ自身何の感覚も持たず、ショパンを知ることもなく、音楽の1音すら聞いたことなく、音楽が出現に至る道筋すら持たない。私はこれを人生の格闘と労苦から鋳出される完全なる人間の魂と比較する。(略)そして感動・動揺・失望・屈従などあなたが思いつく人格形成のための全ての経験とも」。このロマンに溢れた音楽観が人間の経験を表現しようとしていることに私は困惑する。私は何十年にもわたって楽譜の中の音符の黒玉と線を読んできたが、これらの格闘と労苦を見つけることがなかったようだ。

 ホフスタッター同様に、確かに私は、音楽を聴けば同様な、そして時には違った感情を抱く。しかし私は、音楽というものが印刷されたスコアのページの音符の黒玉と線から湧き出てきたものであるというようなあやかしは持ち合わせていない。この感動はわたしのものである。レヴィ=ストロースは、他の意見の中にあって、私が抱くよりはるか先にこの考えを提示した。いわく、人間はあるゆる意味を物に帰する必要があり、それゆえ、音楽を聴いた時には我々はそこに実在していない意味を付与する。このテーマに関して私はジョン・ケージを引用し彼の意見を繰り返さずにはいられない。「ほとんどの人は自分が音楽を聴いている時自分が何かをしているのではなく、何かが彼らに対してしていると思っている。今やこのことは真ではない。我々は音楽を構成(arrange)しなければならない。我々は芸術を構成しなければならない。我々は全てのことを構成して、自分たちがしていると思っていることは本当にしていることなのだと自覚し、何か別物が自分たちに作用しているのだという考えを否定すべきである」。

 おもしろいことに、ホフスタッターは自分が2万行のコード(こちらも点と線からなる)によって感動させられることを懸念しているとコメントした。彼が言うには、コンピュータ作曲の音楽と人間作曲の音楽との区別がつかないということは、(1)音楽はさほど深くないか、 (2) 人間はさほど深くないか。あるいは (3) コンピュータプログラムは我々が想像するよりずっと深いということである。これらの兆候のどれもが彼を失望させるものである。ホフスタッターは憂えてこう言う。「作曲家の魂は音楽には関係ないのか?(私はそうだとは言っていないが)もしそうなら、私は生涯ずっと音楽に騙され続けてきたことになる。(略)」このホフスタッターの意見は、感情移入できるロマンチックな考えではあるが、私はそれを信用していない。

ポピュラー音楽

 私のプロジェクトが蓄えた小さい成功は、私が思うに、西洋調性音楽だけに集中したことによる。これに対して、商用ソフトウェアの世界では、制作者も消費者もクラシック音楽にはほとんど興味がない。私は EMI をポピュラー音楽のために複製することには、ほとんど興味がない。もし私がその分野に冒険しようと思っても、プログラムがポピュラーのジャンルをうまく複製できないだろう。ポピュラー音楽はほとんどの部分を歌詞、特別な音色、演奏の背景にあるものに頼るが、これらはプログラムがうまくコントロールできないファクターである。私が知る単純な事実として、ポピュラー音楽は演奏者が主であり作曲家が主ではないことからもこの問題を認識できる。 

[関連記事] kingfish.hatenablog.com