Style Bert Vits2
TTS (Text To Speech) で日本語の表現に対応した Style-Bert-VITS2 を試してみました。
TTS (Text To Speech) で日本語の表現に対応した Style-Bert-VITS2 を試してみました。
StabilityAI より、Stable Diffusion 3.5 のご紹介 という記事が公開されていました。Stable Diffusion 3.5 Large と Stable Diffusion 3.5 Large Turbo はモデルのダウンロードが可能で、無料で利用可能。Stable Diffusi...
動画生成モデル CogVideo を試してみます。
自作の fastf1 便利ライブラリ を紹介しましたが、こちらも docker compose で簡単・確実に環境を作れるようにします。ついでにいろいろ試すには便利な、JuputerLab を起動するようにします。
Stable Diffusion 3 Medium を実行する環境を ComfyUI で用意した手順 では、コンテナを立ち上げて手動で ComfyUI を構築していました。
ローカルで LLM を動かす際に便利な、OpenWebUI を使ってみます。なお、OpenWebUI はフロントエンドで、バックエンドには Ollama や OpenAI API を使うことができます。
black forest labs. - FLUX.1
ComfyUI の便利なカスタムノード、Impact Pack を紹介します。いろいろな機能を持っているカスタムノードですが、その中でも顔などの画像の特定のエリアの検出や、検出した箇所を新たに生成して置き換えることが可能になります。
LoRA は「Low-Rank Adaptation」の略で、AI の追加学習を効率的に行うための技術のようです。画像全体を学習するのではなく、特定の「何か」に絞って学習するようなイメージですかね。
Stable Diffusion では、解像度が縦横それぞれ 512 ピクセルから 1024 ピクセルの範囲内ぐらいが適切だと思います。それ以上にすると絵が破綻しやすいなどの不具合があります。
GeForce RTX 世代の GPU を使っていると、TensorRT で推論を加速することが可能です。ComfyUI でも TensorRT が利用可能になるカスタムノードを、以下の GitHub で公開してくれているので、こちらを利用してみます。
ComfyUI の便利なカスタムノード、AlekPet を紹介します。これはさまざまな機能を持っていますが、今回はその中でもプロンプトを翻訳してくれる機能を使ってみます。これを使うと、プロンプトを日本語で入力することが可能になります。
少し前になりますが、Stable Audio Open 1.0 がリリース されてました。これを ComfyUI で実行してみました。
ChromeOS の Linux コンテナで GUI アプリを実行した場合、ChromeOS 側の日本語入力をそのまま利用することが可能でした。WSL で実行する Linux の場合、GUI アプリには Windows の IME が反応してくれません。そのため、WSL の Linux に対して日本語入力環境を構...
(2024/8/13 追記) YouTube に操作の様子をアップしました。参考にしてみてください。
Stable Diffusion 3 Medium がリリース されて、ローカルで試してみました が、一枚生成するたびに 12 分もかかると気軽に試せません。しかも WebUI もない・・・と思っていましたが、モデルのページには以下の記述があることを見落としていました。
最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表
WSL は各種ディストリビューションが用意されているので、コマンド 1 つで簡単にそれらをインストールすることができます。WSL ではほぼ標準といえる Ubuntu を使うことが多いですが、WSL が実装される前は実機に Gentoo Linux を入れて使っていました。portage を使った柔軟なパッケージ管...
TripoSRのご紹介:単一画像からの高速3Dオブジェクト生成
画像を読み込み背景を削除して透過してくれる拡張機能です。処理時間は数秒で結構きれいに切り抜いてくれます。
1枚の顔写真と音声データを組み合わせて、その音声をしゃべっているかのように顔を動かせる SadTalker を使ってみます。これは単独のアプリケーションでもありますが、Stable Diffusion の WebUI に拡張機能として使うことが可能なので、この方法で使ってみます。
Red Bull Racing フェルスタッペンのペナルティと、ペレスの低調なペースで一時的とはいえレッドブルの 2 台が最後方に位置するシーンもあったメキシコ GP のレース。序盤にトップに並んだ 4 台 (サインツ、ノリス、ルクレール、フェルスタッペン) のラップチャートを並べてみると、フェルスタッペンのペー...
O.Piastri ピアストリ自身の、チャンスをつかみ取るオーバーテイクや、落ち着き払った (それでいてフェアな) ディフェンスによる、見ごたえのあるトップ争いの末の優勝。車がよいのは間違いないのですが、ドライバーの強さも光るレースでしたね。
Verstappen VS Norris 最後の最後までわからない、手に汗握るトップ争い。その中でスタートを決めたのと、一回目のチャンスでラッセルをオーバーテイクしたフェルスタッペンの強さを改めて感じる結果でした。
ポイント争い 予選で後方に沈んだペレス、ストロールとマグヌッセン。一方 Q3 に進出した角田、ヒュルケンベルグ、リカルド。結果的には、タイヤ交換のタイミングが差を分けました。
L.Norris
スプリント スプリントレースのトップ 8 & リタイアしたアロンソのラップチャートです。
戦略 FP2 で雨が降った影響もあり、あまりデータがない中で迎えた決勝レース。スタート時点でソフトとミディアムでタイヤ選択が分かれましたが、赤旗再スタート時に交換する・しないでも選択が分かれました。また、使用するタイヤもドライバーによってまちまち。それによって、レース中もさまざまなオーバーテイクがみられる、見ごた...
Max Verstappen
Ollie Bearman Eighteen years old and points on his F1 debut 😵Take a bow, Ollie Bearman 👏#F1 #SaudiArabianGP @ScuderiaFerrari pic.twitter.com/cF2ozAt85l&mdash...
Max Verstappen
予選パフォーマンス
自作ライブラリのメソッドを紹介します。今回はlaptime_comperitionです。以下の記事の通り、ff1オブジェクトを作成しておくのと、セッションを読み込んでおいてからの実行となります。
2024 年のシーズンのプレシーズンテストが行われました。数年前まではバルセロナのカタルーニャ・サーキットがテスト地でしたが、昨年に続き開幕戦が行われるバーレーンでのテスト開催となります。
自作ライブラリのメソッドを紹介します。まずはdatachart_compareです。前回の記事の通り、ff1オブジェクトを作成しておくのと、セッションを読み込んでおいてからの実行となります。
fastf1 という、F1 のデータを取得して加工できる python のツールがあります。便利なのですが、都度 matplotlib の使い方を調べてグラフ化するのも面倒なので、グラフ作成の処理はライブラリ化して、必要なパラメータだけ変更できるようにすることで、各セッション後にスムーズに分析できるのでは、と思っ...
背景 初期状態の Minima を使用していましたが、テーマを変更してみました。使用するテーマは Minimal Mistakes。
Jekyll にカテゴリ一覧とタグ一覧のページを追加する で作成したタグ覧ですが、ソートするようにしました。
背景 ブログにカテゴリやタグを設定していましたが、それを表示していなかったので、まるで役に立っていませんでした。とりあえず、それぞれ一覧表示することができるページを作ってみました。
以下投稿の続きです。 GitHub Pages のカスタムドメインを AWS の Route53 で用意する
導入 GitHub Pages は[ユーザー名].github.ioという URL になりますが、任意のドメイン名に変更することも可能です。当然、そのドメイン名を管理できる立場にあることが前提になりますが、ドメイン名の取得から GitHub Pages に設定するところまでやってみます。
タイトルオンリーですが、2024年も静かな一年とはいかないのですかねぇ・・・ 目標 生成 AI (など) を、推論だけではなく学習からやってみたい 2023年は Stable Diffusion など、生成 AI をいろいろ試してみました。それはそれで楽しいのですが、せっかくオープンソースで公開されているの...
背景 Blogger に不満があるわけではないのですが、コードを整形して表示するのが面倒でした。そして、ここにきて突然その表示がされなくなり、どうやっても元通りにならないというのもきっかけです。 Qiita や Zenn も考えたのですが、技術寄りではない投稿も結構あるので、シンプルに静的なページを公開できる (...
事象 Aterm のルーターを使用しているのですが、見えて安心ネット で使用している端末を念のため確認するようにしています。細かく制御はしていないのですが、子どもが使う端末などは夜になったら接続を拒否するといった、曜日や時間での制御もできる点と、機器に任意の名前を付けて表示することができる点が便利です (MAC ...
事象 Windows10 にて、Windows Update がエラーになることに気が付きました。それも、2024-01 の更新で KB5034441。状態はダウンロードエラー - 0x80070643 です。「再試行」をしても、PC を再起動しても症状は変わりません。
事象 Edge の「戻る」と「ワークスペース」のボタンが重なって表示されます。青丸で示した形です。この状態だと、ワークスペースだけクリックできて、戻るがクリックできなくなるので不便です。
ChromeOS は Linux カーネルで動作していますが、基本的には Chrome ブラウザをインターフェースとして使用する形になると思います。crosh というシェルもありますが、これは一部のコマンドしかサポートされません。デベロッパーモードにすればシェルアクセスが可能になりますが、デベロッパーモードは一度...
Windows 11 からリモートデスクトップしようとすると、資格情報の入力を求められてしまいます。保存することもできるはずですが、なぜか保存してもまた入力を求められてしまいます。
事象 OpenSUSE から印刷をできるようにします。使用するプリンターは Canon MG7730。USB 接続ではなく、ネットワーク接続にしています。
事象 OpenSUSE をインストールした MacBook Pro ですが、無線 LAN が認識しない といった目立った症状の他に、何点か気になる点がありました。
事象 MacBook Pro (Retina, 13-inch, Late 2012) に OpenSUSE Tumbleweed をインストール ですが、無線 LAN が使えなくなりました。具体的には、ネットワークアダプタが認識されていません。やはり Broadcom-wl は鬼門です。
購入 ジャンク扱いで表題の MacBook を安く手に入れることができました。A1425、EMC2632 という型番です。動作未確認品での購入でしたが、分解して確認したところ、問題になりそうなのはバッテリーが膨張しているのと SSD が無い点ぐらい。ディスプレイは問題なさそうだったので、バッテリーを交換して使用し...
買ったモノ