Twitter 画像エンコーディングチャレンジ [終了] 質問する

Question

バージョン 1これは私の最初の試みです。進捗に応じて更新します。

私は SO ロゴをほぼロスレスで 300 文字に短縮しました。私のテクニックは SVG ベクターアートへの変換を使用するため、ラインアートに最適です。これは実際には SVG 圧縮器ですが、元のアートをベクター化段階に通す必要があります。

最初の試みでは、オンラインサービスPNGトレースについては、この部分を処理できる無料および有料のツールが多数あります。ポトレース（オープンソース）。

結果は次のとおりです

オリジナル SO ロゴ http://www.warriorhut.org/graphics/svg_to_unicode/so-logo.pngオリジナルデコードされた SO ロゴ http://www.warriorhut.org/graphics/svg_to_unicode/so-logo-decoded.pngエンコードとデコード後

文字数: 300

時間: 測定されていませんが、実質的には瞬時です (ベクトル化/ラスタライズのステップは含みません)

次の段階では、Unicode 文字ごとに 4 つのシンボル (SVG パスポイントとコマンド) を埋め込みます。現時点では、私の Python ビルドには UCS4 のワイド文字サポートがないため、文字ごとの解像度が制限されます。また、最大範囲を Unicode 予約範囲の下限 0xD800 に制限しましたが、許可された文字のリストとそれらを回避するフィルターを作成すれば、理論的には上記のロゴに必要な文字数を 70 ～ 100 まで減らすことができます。

現時点でこの方法の制限は、出力サイズが固定されていないことです。出力サイズは、ベクター化後のベクターノード/ポイントの数に依存します。この制限を自動化するには、画像をピクセル化するか (ベクターの主な利点が失われます)、または、必要なノード数に達するまでパスを単純化ステージで繰り返し実行する必要があります (現在、Inkscape で手動で実行しています)。

バージョン2

更新: v2 が競技に参加できるようになりました。変更点:

コマンドライン制御の入出力とデバッグ
正規表現の代わりにXMLパーサー（lxml）を使用してSVGを処理します
ユニコードシンボルごとに2つのパスセグメントをパックします
ドキュメントとクリーンアップ
style="fill:color" および fill="color" をサポートします
文書の幅と高さを1文字にまとめる
パスの色を1文字にまとめる
色圧縮は、色ごとに 4 ビットの色データを破棄し、それを 16 進変換によって文字にパックすることによって実現されます。

文字数: 133

時間：数秒

v2 デコード済み http://www.warriorhut.org/graphics/svg_to_unicode/so-logo-decoded-v2.pngエンコードとデコード後（バージョン2）

ご覧のとおり、今回はアーティファクトがいくつか発生しています。これは方法の制限ではなく、変換のどこかでミスが発生したためです。アーティファクトは、ポイントが 0.0 - 127.0 の範囲外になると発生し、ポイントを制限しようと試みましたが、成功と失敗が混在していました。解決策は、単に画像を縮小することですが、アートボードやグループマトリックスではなく実際のポイントを拡大縮小するのが難しく、今では気にするほど疲れています。つまり、ポイントがサポートされている範囲内であれば、通常は機能します。

中央の折れ曲がりは、ハンドルがリンクされているハンドルの反対側に移動したことが原因だと思います。基本的に、ポイントがそもそも近すぎます。圧縮する前にソースイメージに簡素化フィルターを実行すると、この問題は修正され、不要な文字がいくつか削除されます。

更新：この方法は単純なオブジェクトには適しているので、複雑なパスを単純化してノイズを減らす方法が必要でした。インクスケープこのタスクでは、Inkscape を使用して不要なパスを整理することに成功しましたが、自動化を試す時間はありませんでした。パスの数を減らすために、Inkscape の「単純化」機能を使用してサンプル SVG をいくつか作成しました。

簡略化は問題なく動作しますが、パスが多数あると遅くなる可能性があります。

オートトレースの例 http://www.warriorhut.org/graphics/svg_to_unicode/autotrace_16_color_manual_reduction.png コーネルボックス http://www.warriorhut.com/graphics/svg_to_unicode/cornell_box_simplified.png レナ http://www.warriorhut.com/graphics/svg_to_unicode/lena_std_washed_autotrace.png

サムネイルをトレース http://www.warriorhut.org/graphics/svg_to_unicode/competition_thumbnails_autotrace.png

超低解像度のショットをいくつか紹介します。これらは 140 文字の制限に近くなりますが、巧妙なパス圧縮も必要になるかもしれません。

手入れされた http://www.warriorhut.org/graphics/svg_to_unicode/competition_thumbnails_groomed.png簡素化され、斑点が除去されました。

三角形 http://www.warriorhut.org/graphics/svg_to_unicode/competition_thumbnails_triangulated.png簡素化され、斑点が除去され、三角形に分割されました。

autotrace --output-format svg --output-file cornell_box.svg --despeckle-level 20 --color-count 64 cornell_box.png

上: 単純化されたパスオートトレース。

残念ながら、私のパーサーは autotrace 出力を処理できないため、使用されているポイントの数や、どの程度簡略化すればよいかがわかりません。残念ながら、締め切りまでにそれを書く時間はほとんどありません。ただし、inkscape 出力よりは解析がはるかに簡単です。

Answer 1

画像ファイルとPythonソース(バージョン1と2)