電卓に知能があるとか、電卓が思考しているとか考える人はもういない。電卓の方が多くの人間より正確に計算してくれるけれど。生成AIは四則演算レベルで、正確な計算をしているかどうかも怪しい。自然言語処理の新しい電卓ではある。次元数を数百とかまで増やして言語と意味をベクトルで位置づけていったら、言語処理をかなり自動化できた。
絵は意味の分解ができておらず、言語の生成AIの機能のうち、隣に来る確率が高い色と形を選ぶ機能だけある。指の隣に指がある確率が高いから、ときどき6本になる。パースも崩れる。
絵は意味の分解ができておらず、言語の生成AIの機能のうち、隣に来る確率が高い色と形を選ぶ機能だけある。指の隣に指がある確率が高いから、ときどき6本になる。パースも崩れる。
Comments
StableDiffusion系は要素の意味付けが弱く、髪とリボンが溶けたり、家具と背景が溶けたりする。眉かまぶたか髪か分からない線を出力する。
色と形の表現の要素について、意味との関連付けを強くしても、弱くしても上手くいかない。オリジナルに近い表現にしないと破綻するから、生成AIは、どこかでみたような絵柄の画像ばかり出力する。著作権侵害の可能性が高い出力が増える。