我从各种在线资源中收集/收集了大量技能。这是我们团队付出的巨大努力。
现在,我们面临的最大挑战是尝试将技能恢复到其根源形式以减少重复。
这里举几个例子,
agile (or) agile methodologies (or) agile software
java 2.x (or) java 3.x (or) java
这种重复很常见是我的数据集。所以我正在寻找一种使它们正常化的方法。
我不太确定解决此问题的方法。谁能建议我一些非常好的方法,我们可以以相当的准确度解决这个问题?
谢谢