如何使用卷积处理深度学习简历/简历解析器?

数据挖掘 深度学习 计算机视觉
2022-03-05 12:42:43

我目前正在寻找一些时间来研究如何使用深度学习制作简历解析器。

我需要一些初步的想法(或)方法来了解如何将事物放在一起,从哪里开始。如果您有任何处理多种类型简历结构的简历解析的好方法,请告诉我。

同样从这里开始我的想法,如果你认为这可行,请告诉我!

1) First I will take a 100 resume as a image(i.e., jpg) file.
2) I will create bounding box around projects/education area and create my training data.
3) After training I'll try to predict it on test data. 

这是一种理想的方法吗?有什么好的方法可以根据任何论文提出建议吗?

非常感激。谢谢。

2个回答

通常,简历不是图像。几乎所有的简历都是 Microsoft Word 或 pdf。鉴于这些文档格式,深度学习解析器应该是基于序列的(例如,循环神经网络 (RNN) 或长短期记忆 (LSTM))。

要应用深度学习,您将需要数千个示例,并标记每个部分。HR-XML (人力资源 - 可扩展标记语言)是简历部分标签的行业标准。

那是一个非常有用的博客。AI、NLP 和深度学习是新时代的概念,它们是新时代简历解析器平台的组成部分。Digital Resume Parser 是一个很好的简历数据提取平台示例,可提供高度准确和快速的数据提取。