设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 152|回复: 7
打印 上一主题 下一主题

[工程技术] 利用 Deepseek 抓取PDF的文字并矫正。

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 17 小时前 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 nanimarcus 于 2025-2-2 13:41 编辑
  {+ ^- s9 B! s3 ^2 y5 s; [# Z0 U& x+ O0 q9 p  K  U
把PDF上传,然后让他抓取文字,并修改可能的错误。
" f8 ~7 P: l1 V. H# {6 s然后deepseek完美的完成了任务。' J; p5 {* d! f# d6 w( o- f
段落清楚,列清楚,页眉页脚全部去掉。0 E( M2 `+ p$ e# M6 r
我要疯掉了!
" c  H' L4 ]8 Q1 I4 {/ e) y& y: S5 J赶紧把自己那些成年老书给搬出来,deepseek,这是党和人民考验你的时候了!8 A3 X1 s$ h- T. d
====
. [+ }; _" H. Z中文也很完美。/ a1 f# @# k! G2 i6 j4 K1 n, p) r
经验值,每次十页比较稳定。
, M" D/ s6 ]+ |( |现在我这里API还不能用,等恢复了,全自动了。
" c- I/ k' O$ L3 \' [5 Q====
8 F1 t+ F2 Z& F9 c- P  j4 K第二次疯掉了!
3 E0 X9 H0 ^- `6 E我上传英文文件后,让他抓取文字,矫正,然让他按页划分,前面放英文,后面放中文,结果仍然完美。9 B; B% N, \0 C& v% r) |, V
====
) C  c1 z5 ~+ Z; `, I/ I现在我让他从PDF抓取文字,矫正后,按段落翻译,可以一次翻译多个段落,每次翻译不超过一个固定数目,结果仍然完美。
# r! v6 A7 z" }0 Z9 O' t但是任务多了后,每次翻译的页面数是减少的。
7 m' X2 T! o) o$ m- Y' h  g1 q: H: K好吧,我五体投地,继续探索。
  a  C& Y6 B: L3 Z; g$ E4 C====
  ~( M" i0 _* c3 T) p为了防止中间结束,可以告诉他必须所有页面全部处理完就可以了,我现在是应该佩服我自己呢还是应该佩服 deepseek 呢,抑或都佩服。
" u8 K: i5 v( j; I====
$ z' J. S# I4 p7 s& `好吧,有些东西是不给翻译的,哈哈。5 f0 A3 l; h: _2 D
/ h9 l$ M8 r' d( W1 A
Sorry, that's beyond my current scope. Let’s talk about something else.' w' Q3 V9 n3 G5 E
====
. w, G5 p& Q9 J! ]然后我的英文命令也让deepseek 帮我修改,呵呵。7 Y/ x0 Y) a$ d! z! L
====  G9 x3 ]! E; T
日语的文本他也可以处理,过程一模一样的。问题也是一模一样的,假名太多,汉字很少,我不懂日语,翻出来都不知道对不对。
* I! {& }9 f5 S====$ a5 V5 l" A. l  n, E, }$ G$ `4 T# Q
时间段的话,北京时间的下午和晚上用比较好。
( J6 P4 o1 u& y6 B! K6 b( ^后半夜和早上,美国人上班了,要么在用,要么在黑客攻击。
) a/ k4 r5 G: x
; _) S2 Q, C" H5 ]3 s
) p( d/ e, F* a0 X2 v$ W! ^0 W1 H2 ^+ p0 Z" ?" X

评分

参与人数 3爱元 +36 学识 +2 收起 理由
老票 + 14 + 2 给力
方恨少 + 12
indy + 10 谢谢分享

查看全部评分

  • TA的每日心情
    开心
    20 小时前
  • 签到天数: 3350 天

    [LV.Master]无

    沙发
    发表于 16 小时前 | 只看该作者
    这功能很赞呀

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    板凳
     楼主| 发表于 16 小时前 | 只看该作者
    马鹿 发表于 2025-2-2 03:53" ~4 N" a4 Y6 {  K0 {
    这功能很赞呀

    . o& _. y& o& I% K! b简直太赞了,我现在正在思考还有什么工作需要 deepseek 干的,现在的上限是我的上限,不是 deepseek 的上限。

    点评

    给力: 5.0 油墨: 5.0
    油菜: 5.0
    油墨: 5 油菜: 5
      发表于 12 小时前
    给力: 5
      发表于 15 小时前

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2022-1-1 00:00
  • 签到天数: 793 天

    [LV.10]大乘

    地板
    发表于 16 小时前 | 只看该作者
    有没有上传整本书试试
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    5#
     楼主| 发表于 16 小时前 | 只看该作者
    indy 发表于 2025-2-2 04:13) r% i" A7 C3 x9 u; D3 {
    有没有上传整本书试试

    - K- y# L; W$ m. }1 Y目前看来,差不多十页左右就停止了,看看还有什么诀窍不。

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10 谢谢分享

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    20 小时前
  • 签到天数: 3350 天

    [LV.Master]无

    6#
    发表于 15 小时前 | 只看该作者
    本帖最后由 马鹿 于 2025-2-1 15:43 编辑 & t3 j) p* b3 {6 s' x

      F. j7 n) a6 |% `1 c# d% Y以后让deepseek 读出土的竹简
    . O% t- |* o. G5 H% O" G- C, b& e$ ~* B1 x% r$ A; v( D( E) y
    还有把古文翻译成现代白话  e5 |, S7 ?6 w6 W+ l& O  T
    ( u: N! T+ j3 ~& z# I4 f1 a) I
    以后不认识的字不查字典了, 直接问deepseek
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-2-2 20:40 , Processed in 0.039758 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表