プライベートや仕事で気づいたことやノウハウなどを書き留めるブログです

2018/04/14

備忘録、文字列の類似度をPowershell:Communary.PASM

0 件のコメント
備忘録として。
Powershellで文字列の類似度を処理するみたいなモジュール
Communary.PASM
https://github.com/gravejester/Communary.PASM

全然わからないけど説明はこちら。
Fuzzy Search with PowerShell


メインはこの3つ。
Select-FuzzyString
Select-SoundexString
Select-ApproximateString

スコアとともに似ている文字列を探せる。
でも、日本語は使えない。
-----
$strs = "John", "Johnny","Peter","Paul","Mark","Jon","Petter","Jan","Robin","Robert";
$strs | Select-FuzzyString er

Score Result
----- ------
  189 Peter
  186 Petter
  187 Robert

-----

何かに


SimString
高速かつシンプルな類似文字列検索ライブラリ
http://www.chokkan.org/software/simstring/index.html.ja

Sorting and String Comparison
https://docs.microsoft.com/en-us/globalization/locale/sorting-and-string-comparison

How to compare strings in C#
https://docs.microsoft.com/en-us/dotnet/csharp/how-to/compare-strings

C#(.Net)の文字列比較が日本語に対応しすぎていて笑えたので、他の比較方法と併せて紹介する。
https://clickan.click/string-equality/

C#で2文書間の類似度をJaccard係数で計算する話
https://kitayamalab.wordpress.com/2017/03/03/c%E3%81%A72%E6%96%87%E6%9B%B8%E9%96%93%E3%81%AE%E9%A1%9E%E4%BC%BC%E5%BA%A6%E3%82%92jaccard%E4%BF%82%E6%95%B0%E3%81%A7%E8%A8%88%E7%AE%97%E3%81%99%E3%82%8B%E8%A9%B1/

SlothLibは .Net Framework 上で利用可能なプログラムライブラリです。 研究目的のプログラムが手軽に作成できるようになることのみを目的とし、 プログラムとしての安全かどうか、高速かどうか、 といったことは二の次と考えています。
http://www.dl.kuis.kyoto-u.ac.jp/slothlib/



[

0 件のコメント :

コメントを投稿