设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 495|回复: 11
打印 上一主题 下一主题

[工程技术] 利用 Deepseek 抓取PDF的文字并矫正。

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 2025-2-2 03:35:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 nanimarcus 于 2025-2-6 22:17 编辑
" Y; U2 r2 h+ U
: O+ C+ W1 G: P; ?* a1 x把PDF上传,然后让他抓取文字,并修改可能的错误。- ]4 d4 P% z# b# B1 ^0 M4 B
然后deepseek完美的完成了任务。$ c# A5 L# Q1 i0 I; }8 o8 A9 d( o
段落清楚,列清楚,页眉页脚全部去掉。- q1 U" q1 ?3 @; ?
我要疯掉了!
' n  h9 |4 N. u赶紧把自己那些成年老书给搬出来,deepseek,这是党和人民考验你的时候了!% e0 B# w3 u5 h
====
& R: u9 ]6 M3 o( Z. o; U中文也很完美。6 `# o! D" l+ u3 D! Z
经验值,每次十页比较稳定。
8 g3 A4 [0 ?; L& W现在我这里API还不能用,等恢复了,全自动了。7 `+ ]4 |, G# J
====8 X& K, V# p" o5 x
第二次疯掉了!
& \1 d; ]! Z8 u/ N$ n0 H# j& d我上传英文文件后,让他抓取文字,矫正,然让他按页划分,前面放英文,后面放中文,结果仍然完美。
1 M8 V/ B& f* B: o! y3 }8 o. \$ y====
' E0 E% r- q8 C现在我让他从PDF抓取文字,矫正后,按段落翻译,可以一次翻译多个段落,每次翻译不超过一个固定数目,结果仍然完美。
% i$ r# r9 i* N0 B' O! h1 ]但是任务多了后,每次翻译的页面数是减少的。! ~, \: D* \8 }9 B8 a: B& w5 `0 L
好吧,我五体投地,继续探索。! [8 E" p1 g1 C* J. v: m
====1 f4 d  D5 U6 B
为了防止中间结束,可以告诉他必须所有页面全部处理完就可以了,我现在是应该佩服我自己呢还是应该佩服 deepseek 呢,抑或都佩服。
* z" o) X$ a1 I* |# C====
1 P( b) p4 l$ C好吧,有些东西是不给翻译的,哈哈。
0 `/ @' P- f" }8 m$ m; o
" c) R& N4 [, DSorry, that's beyond my current scope. Let’s talk about something else." A: M8 z% q; T7 r' P1 f$ Q7 I
====
* `+ \6 m' z- r% t) |/ p然后我的英文命令也让deepseek 帮我修改,呵呵。# V' b. b1 D& k
====
6 h3 f0 i% a9 I* P) @7 y日语的文本他也可以处理,过程一模一样的。问题也是一模一样的,假名太多,汉字很少,我不懂日语,翻出来都不知道对不对。
. H9 [3 ?, b1 ~4 U====) l5 m) o* Z0 N) w4 _; d
时间段的话,北京时间的下午和晚上用比较好。
* f6 L) w0 ?/ P后半夜和早上,美国人上班了,要么在用,要么在黑客攻击。4 j8 @. ~0 _, |# k) H( N0 q8 T
====4 v; T# G3 k) V
用千问吧,非常稳定,非常强大。
8 o9 [) R1 e! F  g" _6 m; xhttps://chat.qwenlm.ai/: y4 f+ f9 S. ?0 G5 w
====
( L1 m( I, l; I5 F. g4 e$ FDeepseek,API 看上去可用了,但是不给充钱。
# y6 f6 ?, d: q' e4 x/ n) B: P# N. C( O+ R; L1 X
1 e: @  T; d+ s" I; O
; O5 o8 q! Q* e3 x2 {4 X  v

评分

参与人数 7爱元 +62 学识 +2 收起 理由
笑羽 + 10
老财迷 + 8
唐家山 + 4
pcb + 4 谢谢分享
老票 + 2 给力

查看全部评分

  • TA的每日心情
    开心
    11 小时前
  • 签到天数: 3370 天

    [LV.Master]无

    沙发
    发表于 2025-2-2 03:53:32 | 只看该作者
    这功能很赞呀

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    板凳
     楼主| 发表于 2025-2-2 03:56:21 | 只看该作者
    马鹿 发表于 2025-2-2 03:53
    7 v9 H3 A) M" B6 [这功能很赞呀
    7 o( D* H5 i, O2 q; q
    简直太赞了,我现在正在思考还有什么工作需要 deepseek 干的,现在的上限是我的上限,不是 deepseek 的上限。

    点评

    给力: 5.0 油墨: 5.0
    油菜: 5.0
    油墨: 5 油菜: 5
      发表于 2025-2-2 08:23
    给力: 5
      发表于 2025-2-2 04:41

    评分

    参与人数 2爱元 +20 收起 理由
    笑羽 + 10
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2022-1-1 00:00
  • 签到天数: 793 天

    [LV.10]大乘

    地板
    发表于 2025-2-2 04:13:28 | 只看该作者
    有没有上传整本书试试
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    5#
     楼主| 发表于 2025-2-2 04:27:15 | 只看该作者
    indy 发表于 2025-2-2 04:13
    $ ~, O$ I$ p# {$ j# w' v有没有上传整本书试试
    : a: ~! {  p! j0 r2 t3 o$ ]" G
    目前看来,差不多十页左右就停止了,看看还有什么诀窍不。

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10 谢谢分享

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    11 小时前
  • 签到天数: 3370 天

    [LV.Master]无

    6#
    发表于 2025-2-2 04:41:51 | 只看该作者
    本帖最后由 马鹿 于 2025-2-1 15:43 编辑 " j' o1 G1 d  q" L9 r) {( n( L

    ) s2 ?- s* h9 F3 H以后让deepseek 读出土的竹简9 j( J7 I, ^5 \) V' J4 J

    4 N" a) z  V' s: V* s+ S) B6 _, b还有把古文翻译成现代白话8 ]+ b0 C1 R. f$ D7 d3 x: J* b, R
    7 s8 b1 J" {. w  I  n" Q$ w1 ?3 H4 A& T
    以后不认识的字不查字典了, 直接问deepseek
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    9 小时前
  • 签到天数: 2530 天

    [LV.Master]无

    7#
    发表于 2025-2-3 01:23:54 | 只看该作者
    请教是如何实现的?
    1 _; T8 E0 L, a; }& M4 {3 t# t6 R: k
    我在网页版和手机版都尝试了,都不行,网页版上传PDF文件始终不成功,手机版上传之后,发出指令提取文件中文字,始终是文件解析中。直接在DS里问如何上传PDF文件,并提取文件中文字,照做其实是一样的。
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    8#
     楼主| 发表于 2025-2-3 03:06:35 | 只看该作者
    方恨少 发表于 2025-2-3 01:230 H$ a! N; x9 \" y+ _! ~" ~
    请教是如何实现的?* \0 U/ q7 U' t- E* [. ^1 \
    5 f, [6 V  t1 L4 \9 ~) V
    我在网页版和手机版都尝试了,都不行,网页版上传PDF文件始终不成功,手机版上传之后 ...
    5 z0 I3 ]/ `1 S2 g
    8 T2 X4 H# j$ Z: a" Y
    我现在也上载不了了,"upload failed",几个小时前还好好的,应该是服务又受攻击所以功能收缩了。
    3 }/ N( R7 {" g7 p2 ?" U# w文字之类的没问题。估计deepseek现在暂时只保证主要功能。9 w7 x0 Q0 x) u' Z
    美国人就这样,打不过就耍流氓,估计要等一段时间才能完全恢复。
    8 g; c2 V+ P3 H, ~6 x, f" p

    点评

    给力: 5.0 涨姿势: 5.0
    给力: 5 涨姿势: 5
      发表于 2025-2-3 03:40
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    9#
     楼主| 发表于 2025-2-5 00:15:37 | 只看该作者
    方恨少 发表于 2025-2-3 01:231 h7 D/ s' U9 h0 A5 G' ~- U5 ]. g
    请教是如何实现的?7 y. f5 N: V7 A6 e6 M8 H3 {" V
    % o2 f: Q, ]# V/ P
    我在网页版和手机版都尝试了,都不行,网页版上传PDF文件始终不成功,手机版上传之后 ...
    3 r2 b, P1 a3 U7 P# s# L* o" w
    https://chat.qwenlm.ai/
    * v! H8 @. ~4 I! N1 Q! x试一下千问,估计美国人没有攻击他,所以资源敞开用。9 u9 O* S. Y8 x
    很稳定,质量不错,好像最多一次处理15页。
    1 F4 i9 Z# V' X$ o2 Z# `我直接拿deepseek的指令用,没有区别。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-2-23 11:38 , Processed in 0.043005 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表