设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 157|回复: 7
打印 上一主题 下一主题

[工程技术] 利用 Deepseek 抓取PDF的文字并矫正。

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 19 小时前 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 nanimarcus 于 2025-2-2 13:41 编辑 * f3 y# a6 L, b# M4 J  f% {' g
( q! f- d% C# V$ k7 b
把PDF上传,然后让他抓取文字,并修改可能的错误。
; {8 G* n, o' g# v, _! u然后deepseek完美的完成了任务。
/ Z/ V2 ?( c8 ?' ]段落清楚,列清楚,页眉页脚全部去掉。7 U7 q* T" d. x+ a9 p1 c
我要疯掉了!* ?: M' v! y9 T# y
赶紧把自己那些成年老书给搬出来,deepseek,这是党和人民考验你的时候了!
5 D2 R% C+ A8 y. F8 m====
- f( Z& \, R: L( r中文也很完美。
* y- u8 D& \0 E% t+ W6 Y. o: Y0 m经验值,每次十页比较稳定。0 u6 C/ [1 P5 H( i. Z
现在我这里API还不能用,等恢复了,全自动了。0 \+ Z% J$ @& O1 y/ m+ k% M
====
( i9 d9 {0 ]2 u( v2 U第二次疯掉了!
2 l4 s6 i  P! }. E) C4 h我上传英文文件后,让他抓取文字,矫正,然让他按页划分,前面放英文,后面放中文,结果仍然完美。
+ T4 y+ G* N% d  I5 W====7 T9 T5 R4 x' e8 e" E
现在我让他从PDF抓取文字,矫正后,按段落翻译,可以一次翻译多个段落,每次翻译不超过一个固定数目,结果仍然完美。+ X. S8 O0 X! `- O6 V. Q
但是任务多了后,每次翻译的页面数是减少的。& S# o% s' T0 N# ~) }0 K3 E
好吧,我五体投地,继续探索。: y. L/ _: B3 T5 B5 t
====
& C3 J7 J& A8 X* `; m5 \7 ~为了防止中间结束,可以告诉他必须所有页面全部处理完就可以了,我现在是应该佩服我自己呢还是应该佩服 deepseek 呢,抑或都佩服。
$ S, `4 w' o. [/ p/ ]====
' T7 [  H1 h3 C, z" b$ O9 g- \3 J好吧,有些东西是不给翻译的,哈哈。
3 Y1 `: [: m# [: J$ V/ [: N, U# a1 M
Sorry, that's beyond my current scope. Let’s talk about something else.1 s3 J$ s2 |' A" }/ f3 S- z* f( c
====
* ]1 W, Z2 N1 ?/ `, E然后我的英文命令也让deepseek 帮我修改,呵呵。& I: K2 I- I# J7 }/ W2 i6 d
====
# V5 y/ t5 P) ]2 B日语的文本他也可以处理,过程一模一样的。问题也是一模一样的,假名太多,汉字很少,我不懂日语,翻出来都不知道对不对。
6 `6 }% A4 [& q" m, j====
9 T, b7 U. _3 Q: q时间段的话,北京时间的下午和晚上用比较好。
( x; v% N9 h' B* ^0 `# |7 P; w后半夜和早上,美国人上班了,要么在用,要么在黑客攻击。
$ b+ |0 Q/ z8 z/ c$ q0 f
+ }. P3 E, f7 l9 F) H" Z: y; V8 f- i2 D# Z# }! @
4 }% p2 p9 r3 O, c# d

评分

参与人数 3爱元 +36 学识 +2 收起 理由
老票 + 14 + 2 给力
方恨少 + 12
indy + 10 谢谢分享

查看全部评分

  • TA的每日心情
    开心
    22 小时前
  • 签到天数: 3350 天

    [LV.Master]无

    沙发
    发表于 18 小时前 | 只看该作者
    这功能很赞呀

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    板凳
     楼主| 发表于 18 小时前 | 只看该作者
    马鹿 发表于 2025-2-2 03:53
    $ I% r1 h9 R! t- D* E$ z这功能很赞呀
    / \: ~2 j# `$ ^1 z- M/ m0 s( O
    简直太赞了,我现在正在思考还有什么工作需要 deepseek 干的,现在的上限是我的上限,不是 deepseek 的上限。

    点评

    给力: 5.0 油墨: 5.0
    油菜: 5.0
    油墨: 5 油菜: 5
      发表于 14 小时前
    给力: 5
      发表于 18 小时前

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2022-1-1 00:00
  • 签到天数: 793 天

    [LV.10]大乘

    地板
    发表于 18 小时前 | 只看该作者
    有没有上传整本书试试
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    5#
     楼主| 发表于 18 小时前 | 只看该作者
    indy 发表于 2025-2-2 04:13% m" [- X) [2 M) n: s; p) \# B+ T
    有没有上传整本书试试
    1 C5 m2 D& N0 c8 u* Z2 ]
    目前看来,差不多十页左右就停止了,看看还有什么诀窍不。

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10 谢谢分享

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    22 小时前
  • 签到天数: 3350 天

    [LV.Master]无

    6#
    发表于 18 小时前 | 只看该作者
    本帖最后由 马鹿 于 2025-2-1 15:43 编辑
    6 f: U& J2 Z( a+ o9 I6 v3 g
    ( c+ ]. e# o' Y6 A$ G以后让deepseek 读出土的竹简
    - R3 k+ v( S8 g3 V8 P8 J$ q& M/ q8 o3 w( \
    还有把古文翻译成现代白话
    0 \1 O# V! W6 X; j* Q5 L9 D) Q) p- m
    以后不认识的字不查字典了, 直接问deepseek
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-2-2 22:46 , Processed in 0.036283 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表