Berhadapan dengan satu tugasan untuk memadankan 2 data set berbeza. Cabarannya utamanya adalah tiada unik key yang dapat membantu. Hanya nama syarikat yang diberikan (sudah semestinya "free text") saya perlu memadanan ratusan syarikat untuk membuat analysis.
Mujur ada program ini. Ia memadankan nama syarikat dan menentukan peratusan persamaan antara satu sama lain.
Sebagai contohfrom thefuzz import fuzz
from thefuzz import process
fuzzy_ratio = fuzz.ratio("ABC (M) Sdn Bhd", "ABC (Malaysia) Sdn. Bhd.")
print(fuzzy_ratio)
-----
77
Discussion about this post
No posts