更新日志

v2.3.0 - 2020/08/25

  • 文件解析优化
    • doc文件部分textbox问题处理;
    • unicode特殊偏旁文字识别与替换;
  • 工作经历-带括号的token识别优化;
  • 项目经历-对齐逻辑优化处理;
  • 人名识别-特殊符号识别过滤;
  • 词典优化-部分实体的增删改;
  • 其他-输入参数file_name强制带上后缀名;

v2.2.0 - 2020/06/06

  • 工作经历优化v3.0
    • 流程重写,考虑更多feature,效果更强大;
    • 过滤逻辑优化,提升准确率;
    • 实体格式化,结果更规范;
  • 邮件解析v1.0
    • 新增邮件解析接口;
  • 其他关键优化点
    • 独立学院的处理;
    • 多个项目经历的识别和分析;
    • 部分pdf解析为空问题的处理;

v2.1.3 - 2020/04/21

  • 关键字段优化
    • 姓名解析优化v3.0;
    • 工作经历下错误分段优化;
    • 项目经历下职位识别bugfix;
  • 文件解析和提取优化
    • eml特殊格式处理;
    • 部分网站格式优化;
    • concat逻辑优化;

v2.1.2 - 2020/03/23

  • 词典优化
    • 行业词典整理;
    • 公司词典:+100%,达千万级;
    • 学校词典:+40%;
  • 实体识别优化
    • 项目名称识别bugfix;
    • 公司名称识别bugfix;
    • 并列职位名称识别;
  • 英文简历解析优化
    • 姓名识别优化:增加对港澳台姓氏的支持;
    • 分段识别优化;

v2.1.1 - 2020/03/01

  • 基本信息优化
    • 姓名识别优化:线下准确率从96%提升至98%左右;
    • 电话号码识别,增加对港澳台及国际电话号码格式的支持;
  • 附件解析优化
    • 解决PDF格式unicode字符规范化问题;
  • 英文简历解析优化
    • 日期识别增加召回规则,提升10%左右;
    • 工作经历识别优化,加入深度学习模型的支持;

v2.1.0 - 2020/02/01

  • 接口优化
    • 分段内容保留原始大小写格式信息;
    • 返回代码规范化;
  • 附件解析优化
    • 提升对PDF特殊排版模式的判别,解决乱序问题;
    • 头像提取bugfix;
  • 英文简历解析优化
    • 英文人名识别优化,大约提升10%准确率;
    • 教育经历解析优化,提升学校识别和分段识别的效果;

v2.0.1 - 2019/09/01

  • 词典数据优化
    • 对公司、职位等词典进行清洗(万级)
    • 补充常见的公司名和学校名(千级);
  • 识别模型优化
    • 使用深度学习新模型重新训练识别模型,线下评估准确率从95%提升至98%;

v2.0.0.1 - 2019/06/01

  • 头像识别优化
    • 采用新算法进行识别,准确率从80%+提升至90%+左右;
  • 基础组件升级
    • ft版本从0.8.1升级至0.8.3;
  • 过滤误识别的教育经历;

v2.0.0 - 2019/03/01

  • 增加10多个新解析字段,让解析结果更细化、更规范化,比如对城市、地点的规范化。增加的字段包括:
    • resume_name
    • resume_parse_time
    • work_industry
    • work_year_inf
    • work_start_time_inf
    • work_salary_min
    • work_salary_max
    • ...
  • 优化取值
    • 优化resume_source(简历来源)的取值范围;
    • 优化简历头像的取值;
  • 人岗匹配功能上线;(人岗匹配相关套餐才包含该功能)

v1.6.2 - 2019/01/01

  • 增加招聘网站规则模板适配,提取更加精准;
  • 项目名称识别模型重新训练,校正对公司名/职位名的误识别问题;
  • 基础组件升级
    • gs版本从v2.1升级到v3.4;
    • 采用更好的分词器版本,性能提升25%左右;

v1.6.1 - 2018/11/01

  • 基本信息优化
    • 姓名识别优化:去除常见的城市名误识别;
    • 增加对基本信息里期望公司字段的识别;
  • 词典优化
    • 职位词典:增加千级常见职位名称;
  • 分组识别优化
    • 增加新的分组模板;
  • 基础组件升级
    • gs版本从v2.1升级到v3.4;
    • 采用更好的分词器版本,性能提升25%左右;

v1.6.0 - 2018/08/01

  • 基本信息识别优化
    • 姓名解析模型:利用千万量级的语料重新训练,准确率提升2个点;
    • 电话号码识别:新前缀的加入,同时增加对台湾区号的识别;
  • 分组识别优化
    • 教育经历增加predict功能,提升准确;
    • 项目经历采用实体+位置的联合识别策略,准确率提升30%;

v1.5.1 - 2018/04/01

  • 性能优化(速度提升40%)
    • 各类实体识别增加cache功能;
    • log日志增加级别控制机制;
    • 增加对超长标点字符串的识别和过滤;

v1.5.0 - 2017/12/01

  • 英文解析优化
    • 增加对新分组模板的识别;
    • 增加对项目经验的解析;
  • 英文解析优化
    • 修复高并发下解析串写的bug;
    • 提升某些异常简历的解析准确率;

v... - ......

v0.1.0 - 2014/07/01

  • 简历解析项目启动开发