クレジット会社要請の規制ワードの置き換えを素数にしたら?という話を見たが、単語をword2vecとかでベクトル化して、コサイン類似度を適度に離した単語にすればどう?とか思ってPythonでMetaのfastTextとgensimを使って類似性を見てみた。ひよことロリポップが92番目の類似度。
この話を見た。
「アダルト表現の言い換えを素数にすれば、規制にも遭わず言葉の汚染も起こらず良いのではという話」https://t.co/wn4oefmTie
— Togetter(トゥギャッター) (@togetter_jp) March 27, 2024
が伸びてるみたい。内容が気になるね! 作成者:@takecun01
なんかよくわからんことになってるな。
これで私も違法素数を思い出したが、それとは別に言葉のいいかえならこの機械学習全盛の時代なら機械学習でやらせればいいのではと思ったり。
使うのはMeta(Facebook)のFastTextにしよう。
日本語のデータはここからダウンロードできる。
https://fasttext.cc/docs/en/crawl-vectors.html
使い方はこちらを参考に。
https://qiita.com/Amby/items/b982413c05cb50bb5e0a
では”ひよこ”のコサイン類似度の上位2000位まで見てみよう。プログラムはこんな感じで。
で92位にロリポップが現れた!なるほど割と近い?
ロリは1910位。
コサイン類似度が0.3程度で選べばいいのでは。
しかし…2000位近くに”アンパンマンパンクッキングバカ”とか出てくる…なんだこりゃ。
”
« またUSBメモリ紛失の話が…禁止になったときのためにQRコードで最大の文字数が入るversion 40を試してみる。PythonのpyqrcodeでQRコード作って、iPhoneのアプリで読んでみる。Fakerでダミーデータ(名前、住所、電話番号など)を作って。 | トップページ | 河童ラーメン本舗で黒河童ラーメン+からあげセットをいただく。やはりここのラーメンが一番好き。替え玉1つ無料でキムチも食べ放題。 »
「パソコン・インターネット」カテゴリの記事
- 高周波回路シミュレータQucsStudioがuSimmicsに名称変更し、バージョンも4.8.3から5.8にアップデートされた。Qucsと区別するためだそうだ。また、Pythonの高周波用ライブラリscikit-rfもv1.5.0にバージョンアップされていた(2024.12.04)
- MATLAB Onlineで高周波基板設計用のRF PCB Toolboxを使ってみる。Coupled line バンドパスフィルタやratraceカプラが設計できる。モーメント法(MoM)や有限要素法(FEM)でちゃんと計算してくれているようだ。(2024.12.06)
- MATLAB Onlineで高周波用のRF Toolboxを使ってみる。Touchstoneファイルの読み込み、dB表示グラフ、スミスチャートなど簡単にできるし、フィルタ合成やIEEE P370 De-embedding(ZC-2xThru)も使える(MATLABで書かれたものがオリジナル)。(2024.12.05)
- MATLAB OnlineのSimulinkでローレンツ方程式をode8で計算してみる。Interface 2025年1月号でMATLAB Onlineの半年ライセンスがついてきたので。Simulinkを使うのは初めてだったが、わかりやすいSimulink入門コースを修了したのですぐできた。(2024.12.04)
- Interface2025年1月号はMATLABで1ニューロンから手作り 数学&図解でディープ・ラーニング。初歩からAlexNetの転移学習、CNNまで話題が豊富で、なんとMatlab Onlineの半年ライセンスがついてくる。Simulinkや各種toolboxも使える。早速MATLAB入門オンラインコース修了した。(2024.12.03)
「学問・資格」カテゴリの記事
- 高周波・RFニュース 2024年12月11日 5G AmericasがセルラーネットワークでのAIのホワイトペーパー、GSAが2024年の5Gレビュー、NordicがIoTに適したThingy:91 X発表、Wi-Fi 6GHzが世界でどうなっているか、Huaweiが5G GaNパワーアンプで有利、Samsung Galaxy M34 5G分解(2024.12.11)
- 高周波・RFニュース2024年12月9日 iFixitがDJI Neo分解、TechInsightsがApple Pencil Pro分解、QualcommのNeurIPS 2024でのAI技術発表、IntelのIEDM 2024での発表、 Nokiaの7GHz帯の6G、Analog DevicesのPhased Array Antennaのホワイトペーパー、ZDTが史上二番目の売上高(2024.12.09)
- 高周波・RFニュース 2024年12月6日 NGMNが無線パフォーマンス評価フレームワーク発行、5GAAがC-V2Xのロードマップ発行、Marvellの3nm 1.6Tbps PAM4インターコネクト、Nokiaの2.4Tbps光伝送、Silicon Labsの低消費電力モジュール、Xiaomi 14T Pro分解動画(2024.12.06)
- 高周波回路シミュレータQucsStudioがuSimmicsに名称変更し、バージョンも4.8.3から5.8にアップデートされた。Qucsと区別するためだそうだ。また、Pythonの高周波用ライブラリscikit-rfもv1.5.0にバージョンアップされていた(2024.12.04)
- 日経サイエンス2025年1月号の特集 和算再発見の佐藤賢一さんの記事「算聖 関孝和の実像」に出てきた矢高に対する円弧の2乗の近似式をカシオの高精度計算サイトkeisan.casio.jpの自作式として作った。ものすごい精度であることがよくわかる。(2024.12.03)
「日記・コラム・つぶやき」カテゴリの記事
- 高周波・RFニュース 2024年12月11日 5G AmericasがセルラーネットワークでのAIのホワイトペーパー、GSAが2024年の5Gレビュー、NordicがIoTに適したThingy:91 X発表、Wi-Fi 6GHzが世界でどうなっているか、Huaweiが5G GaNパワーアンプで有利、Samsung Galaxy M34 5G分解(2024.12.11)
- 高周波・RFニュース2024年12月9日 iFixitがDJI Neo分解、TechInsightsがApple Pencil Pro分解、QualcommのNeurIPS 2024でのAI技術発表、IntelのIEDM 2024での発表、 Nokiaの7GHz帯の6G、Analog DevicesのPhased Array Antennaのホワイトペーパー、ZDTが史上二番目の売上高(2024.12.09)
- 高周波・RFニュース 2024年12月6日 NGMNが無線パフォーマンス評価フレームワーク発行、5GAAがC-V2Xのロードマップ発行、Marvellの3nm 1.6Tbps PAM4インターコネクト、Nokiaの2.4Tbps光伝送、Silicon Labsの低消費電力モジュール、Xiaomi 14T Pro分解動画(2024.12.06)
- 高周波回路シミュレータQucsStudioがuSimmicsに名称変更し、バージョンも4.8.3から5.8にアップデートされた。Qucsと区別するためだそうだ。また、Pythonの高周波用ライブラリscikit-rfもv1.5.0にバージョンアップされていた(2024.12.04)
- 日経サイエンス2025年1月号の特集 和算再発見の佐藤賢一さんの記事「算聖 関孝和の実像」に出てきた矢高に対する円弧の2乗の近似式をカシオの高精度計算サイトkeisan.casio.jpの自作式として作った。ものすごい精度であることがよくわかる。(2024.12.03)
« またUSBメモリ紛失の話が…禁止になったときのためにQRコードで最大の文字数が入るversion 40を試してみる。PythonのpyqrcodeでQRコード作って、iPhoneのアプリで読んでみる。Fakerでダミーデータ(名前、住所、電話番号など)を作って。 | トップページ | 河童ラーメン本舗で黒河童ラーメン+からあげセットをいただく。やはりここのラーメンが一番好き。替え玉1つ無料でキムチも食べ放題。 »
コメント