设为首页收藏本站

爱吱声

 找回密码
 注册
搜索
查看: 163|回复: 8
打印 上一主题 下一主题

[工程技术] 利用 Deepseek 抓取PDF的文字并矫正。

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 昨天 03:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 nanimarcus 于 2025-2-2 13:41 编辑 0 V  I& n6 f8 }5 F( U, T
8 o* C  _1 E# M
把PDF上传,然后让他抓取文字,并修改可能的错误。
3 j" f0 I1 W% C4 i然后deepseek完美的完成了任务。0 L- C% [% E" d$ q8 ^, S8 s( }6 u
段落清楚,列清楚,页眉页脚全部去掉。
8 O5 P# U% X6 J我要疯掉了!1 e  b# @5 l% a4 _9 }
赶紧把自己那些成年老书给搬出来,deepseek,这是党和人民考验你的时候了!* D! ?" E- t5 o" H6 E- c
====, q9 c# n7 o% s* a) P2 L# a, @6 z
中文也很完美。
7 w* w. t6 T7 L经验值,每次十页比较稳定。; i- @4 t$ F: P- w; z1 U/ H
现在我这里API还不能用,等恢复了,全自动了。
+ l* v4 R. D  S$ a- v. ?# e8 o! y& D====
" G2 ?* {1 K  V3 w第二次疯掉了!* S& N0 d) e0 }$ x! _" C
我上传英文文件后,让他抓取文字,矫正,然让他按页划分,前面放英文,后面放中文,结果仍然完美。% P% F# ~' q: |9 ]0 b9 s- H
====
/ w) b( S2 |8 t# g. Z+ R现在我让他从PDF抓取文字,矫正后,按段落翻译,可以一次翻译多个段落,每次翻译不超过一个固定数目,结果仍然完美。% B* R7 \; ?9 x" g
但是任务多了后,每次翻译的页面数是减少的。
- i) T* X. k1 f- a7 d4 Z* [好吧,我五体投地,继续探索。
" U6 e2 X: P( b$ a8 m' L====
0 j$ \; o0 i/ a0 `, N为了防止中间结束,可以告诉他必须所有页面全部处理完就可以了,我现在是应该佩服我自己呢还是应该佩服 deepseek 呢,抑或都佩服。
( N, k! O/ B- P) X1 R) S====
- T1 L3 R6 i* u好吧,有些东西是不给翻译的,哈哈。
, W! J' a$ [/ ?3 _: K) C$ a+ [# _3 H$ n" d& x2 J0 E! D( _
Sorry, that's beyond my current scope. Let’s talk about something else.
6 a1 L2 ?& H* w; {2 p& L; G====3 V% C6 [+ q! _- A. G4 ?4 f# c) J& t
然后我的英文命令也让deepseek 帮我修改,呵呵。( u) x( a# n( U. @# W
====
! v, i1 P3 B( Y日语的文本他也可以处理,过程一模一样的。问题也是一模一样的,假名太多,汉字很少,我不懂日语,翻出来都不知道对不对。
% C! `, W9 T8 b# N! H====
* t$ S+ K/ _$ |' ^7 I时间段的话,北京时间的下午和晚上用比较好。7 a0 A+ _; x3 l9 ~7 O8 G
后半夜和早上,美国人上班了,要么在用,要么在黑客攻击。
) ^" ?! x  ~9 ^; w% F/ }
( f6 _' w1 {# F5 b. P7 K
7 J. t8 \3 N* Z7 `6 }8 e
% L) V( N4 W/ W, u0 S

评分

参与人数 4爱元 +40 学识 +2 收起 理由
pcb + 4 谢谢分享
老票 + 14 + 2 给力
方恨少 + 12
indy + 10 谢谢分享

查看全部评分

  • TA的每日心情
    开心
    1 小时前
  • 签到天数: 3351 天

    [LV.Master]无

    沙发
    发表于 昨天 03:53 | 只看该作者
    这功能很赞呀

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    板凳
     楼主| 发表于 昨天 03:56 | 只看该作者
    马鹿 发表于 2025-2-2 03:53
    1 a$ e4 d# e. H- W这功能很赞呀
    + Z, ~4 ?/ F/ {/ f5 N
    简直太赞了,我现在正在思考还有什么工作需要 deepseek 干的,现在的上限是我的上限,不是 deepseek 的上限。

    点评

    给力: 5.0 油墨: 5.0
    油菜: 5.0
    油墨: 5 油菜: 5
      发表于 昨天 08:23
    给力: 5
      发表于 昨天 04:41

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    2022-1-1 00:00
  • 签到天数: 793 天

    [LV.10]大乘

    地板
    发表于 昨天 04:13 | 只看该作者
    有没有上传整本书试试
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    5#
     楼主| 发表于 昨天 04:27 | 只看该作者
    indy 发表于 2025-2-2 04:13( S" U! k3 R/ I& k/ [2 x
    有没有上传整本书试试

    4 L2 g$ k! ]+ @) n; e目前看来,差不多十页左右就停止了,看看还有什么诀窍不。

    评分

    参与人数 1爱元 +10 收起 理由
    indy + 10 谢谢分享

    查看全部评分

    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    1 小时前
  • 签到天数: 3351 天

    [LV.Master]无

    6#
    发表于 昨天 04:41 | 只看该作者
    本帖最后由 马鹿 于 2025-2-1 15:43 编辑
    5 y8 V5 }: z0 t) U7 C6 C( b# Q
    + i9 ?( w, w" t6 s以后让deepseek 读出土的竹简
    - z; L" ?2 s0 ~/ S+ X  C
    5 @+ u3 v! F2 b! m8 @% @还有把古文翻译成现代白话# b& m9 ?' F( u3 Q/ v" J

    6 b8 g* p% f, l) s2 y以后不认识的字不查字典了, 直接问deepseek
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    昨天 04:31
  • 签到天数: 2509 天

    [LV.Master]无

    7#
    发表于 半小时前 | 只看该作者
    请教是如何实现的?
    5 ~, e- ?8 E1 {# l" N) [* k
    ; |- ~# e( o" ]我在网页版和手机版都尝试了,都不行,网页版上传PDF文件始终不成功,手机版上传之后,发出指令提取文件中文字,始终是文件解析中。直接在DS里问如何上传PDF文件,并提取文件中文字,照做其实是一样的。
    回复 支持 反对

    使用道具 举报

    手机版|小黑屋|Archiver|网站错误报告|爱吱声   

    GMT+8, 2025-2-3 01:57 , Processed in 0.032613 second(s), 19 queries , Gzip On.

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表