快速开始

  1. >>> from tgrocery import Grocery
  2. # 新开张一个杂货铺(别忘了取名)
  3. >>> grocery = Grocery('sample')
  4. # 训练文本可以用列表传入
  5. >>> train_src = [
  6. ('education', '名师指导托福语法技巧:名词的复数形式'),
  7. ('education', '中国高考成绩海外认可 是“狼来了”吗?'),
  8. ('sports', '图文:法网孟菲尔斯苦战进16强 孟菲尔斯怒吼'),
  9. ('sports', '四川丹棱举行全国长距登山挑战赛 近万人参与')
  10. ]
  11. >>> grocery.train(train_src)
  12. # 也可以用文件传入(默认以tab为分隔符,也支持自定义)
  13. >>> grocery.train('train_ch.txt')
  14. # 保存模型
  15. >>> grocery.save()
  16. # 加载模型(名字和保存的一样)
  17. >>> new_grocery = Grocery('sample')
  18. >>> new_grocery.load()
  19. # 预测
  20. >>> new_grocery.predict('考生必读:新托福写作考试评分标准')
  21. education
  22. # 测试
  23. >>> test_src = [
  24. ('education', '福建春季公务员考试报名18日截止 2月6日考试'),
  25. ('sports', '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜'),
  26. ]
  27. >>> new_grocery.test(test_src)
  28. # 输出测试的准确率
  29. 0.5
  30. # 同样可支持文件传入
  31. >>> new_grocery.test('test_ch.txt')
  32. # 自定义分词模块(必须是一个函数)
  33. >>> custom_grocery = Grocery('custom', custom_tokenize=list)