news 2026/3/22 17:36:46

wangEditor实现word文档公式粘贴转MathML

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
wangEditor实现word文档公式粘贴转MathML

《独立开发者的"富文本粘贴攻坚战":从Word地狱到云端救赎的技术实录》
——上海.NET程序员的破局之路

第一章:当需求文档变成"技术恐怖片"

作为独立开发者,我独自维护着一个基于Vue2 + wangEditor的文档协作平台。某天,产品经理甩来一份需求:
“需要支持从Word/Excel/PPT/PDF直接粘贴/导入内容,图片自动上传至阿里云OSS,且保留原始样式(字体/颜色/表格等)。后端用ASP.NET Core,数据库SQL Server。”

我盯着屏幕陷入沉思:这哪是需求,分明是**“全栈开发者の终极试炼”**。


第二章:前端战场——wangEditor的"粘贴拦截术"

1. 破解Word的"脏HTML"陷阱

Word粘贴的内容自带等Office专属标签,直接渲染会乱码。我的解决方案:

// wangEditor配置增强consteditor=newWangEditor('#editor')editor.config.pasteFilterStyle=false// 允许基础样式editor.config.pasteIgnoreImg=false// 不忽略图片// 自定义粘贴处理editor.config.customPaste=(editor,html)=>{// 1. 清理Office冗余标签(正则暴击)letcleanHtml=html.replace(//g, '') // 移除Office绘图标签.replace(/<\/o:p>/g,' ')// 换行符转换.replace(//g, '') // 移除注释// 2. 提取Base64图片并触发上传returnextractImagesAndUpload(cleanHtml)}
2. 图片自动上传:从Base64到Blob的蜕变

Word图片默认是Base64编码,直接传输效率低下。我实现了分步处理:

asyncfunctionextractImagesAndUpload(html){constparser=newDOMParser()constdoc=parser.parseFromString(html,'text/html')constimages=doc.querySelectorAll('img[src^="data:image"]')for(letimgofimages){constbase64=img.src.split(',')[1]constblob=awaitbase64ToBlob(base64)// 自定义转换函数// 调用ASP.NET后端APIconstformData=newFormData()formData.append('file',blob,'word-image.png')fetch('/api/upload',{method:'POST',body:formData}).then(res=>res.json()).then(data=>{img.src=data.url// 替换为OSS URL})}returndoc.body.innerHTML}

效果:用户粘贴Word后,图片自动上传至OSS,编辑器内显示可访问的URL,且保留了原始字体、颜色等样式。


第三章:后端战场——ASP.NET Core的"对象存储攻防战"

1. 文件接收与OSS上传

创建专门的FileUploadController处理图片上传:

[ApiController][Route("api/[controller]")]publicclassUploadController:ControllerBase{privatereadonlyIOSSClient_ossClient;// 阿里云OSS封装接口[HttpPost]publicasyncTaskUpload(IFormFilefile){if(file==null||file.Length==0)returnBadRequest();// 生成唯一文件名varext=Path.GetExtension(file.FileName);varfileName=$"{Guid.NewGuid()}{ext}";// 上传至OSS(使用阿里云SDK)usingvarstream=file.OpenReadStream();await_ossClient.PutObjectAsync("your-bucket",$"uploads/{fileName}",stream);// 返回可访问URLvarurl=$"https://your-bucket.oss-cn-shanghai.aliyuncs.com/uploads/{fileName}";returnOk(new{url});}}
2. 文档导入:多格式转换方案

针对不同文档类型采用不同策略:

① Word/Excel/PPT → HTML
使用LibreOffice(通过Docker部署):

publicasyncTaskConvertOfficeToHtml(stringfilePath,stringfileType){varoutputPath=Path.Combine("/tmp",$"{Guid.NewGuid()}.html");// 调用LibreOffice命令行转换varprocess=newProcess{StartInfo=newProcessStartInfo{FileName="soffice",Arguments=$"--headless --convert-to html:{fileType}--outdir /tmp{filePath}",RedirectStandardOutput=true,UseShellExecute=false}};awaitprocess.StartAsync();awaitprocess.WaitForExitAsync();returnFile.ReadAllText(outputPath);}

② PDF → HTML
使用pdf2htmlEX(需单独安装):

publicasyncTaskConvertPdfToHtml(stringfilePath){varoutputPath=Path.Combine("/tmp",$"{Guid.NewGuid()}.html");varprocess=newProcess{StartInfo=newProcessStartInfo{FileName="pdf2htmlEX",Arguments=$"--zoom 1.3{filePath}{outputPath}",RedirectStandardOutput=true,UseShellExecute=false}};awaitprocess.StartAsync();awaitprocess.WaitForExitAsync();returnFile.ReadAllText(outputPath);}

坑点记录

  • LibreOffice转换Excel时,复杂公式可能丢失
  • pdf2htmlEX生成的HTML需要额外CSS重置样式
  • 所有转换工具建议通过Docker部署,避免环境污染

第四章:数据库设计——SQL Server的"元数据管理"

为支持文档历史版本,设计了以下表结构:

CREATETABLEDocuments(Id UNIQUEIDENTIFIERPRIMARYKEY,Title NVARCHAR(255),Content NVARCHAR(MAX),-- 存储最终HTMLCreatedAtDATETIMEDEFAULTGETDATE(),UpdatedAtDATETIMEDEFAULTGETDATE());CREATETABLEDocumentImages(Id UNIQUEIDENTIFIERPRIMARYKEY,DocumentId UNIQUEIDENTIFIERFOREIGNKEYREFERENCESDocuments(Id),ImageUrl NVARCHAR(512),OriginalName NVARCHAR(255),SizeINT,UploadTimeDATETIMEDEFAULTGETDATE());

第五章:同行互助——QQ群里的"技术急救"

在开发过程中,加入QQ群:223813913后发现:

  • @北京-张工:“推荐用Mammoth.js处理Word,比LibreOffice轻量!”
  • @深圳-李姐:“Excel转换后表格线消失?试试OpenXML SDK直接解析.xlsx”
  • @杭州-王总:“阿里云OSS上传建议用预签名URL,避免前端直接传密钥”

群内资源推荐

  • 前端:mammoth.js(Word转HTML)
  • 后端:NPOI(.NET处理Office文件)
  • 工具:Docker(隔离转换环境)

最终成果:从需求到上线的完整闭环

现在系统支持:
Word粘贴:内容+图片自动上传,样式保留
多文档导入:Word/Excel/PPT/PDF一键转换
对象存储:图片存阿里云OSS,支持CDN加速
版本管理:SQL Server记录文档修改历史

技术栈总结

  • 前端:Vue2 + wangEditor(粘贴拦截+图片上传)
  • 后端:ASP.NET Core(文件处理+OSS SDK)
  • 转换工具:LibreOffice + pdf2htmlEX
  • 存储:阿里云OSS + SQL Server

最后呼吁
如果你也在攻克富文本编辑器难题,欢迎加入QQ群:223813913,这里没有"菜鸟",只有"即将成为大神的同行"!

(完)
——上海独立开发者·陈工

复制插件文件


安装jquery

npm install jquery

导入组件

importEfrom'wangeditor'const{$,BtnMenu,DropListMenu,PanelMenu,DropList,Panel,Tooltip}=Eimport{WordPaster}from'../../static/WordPaster/js/w'import{zyCapture}from'../../static/zyCapture/z'import{zyOffice}from'../../static/zyOffice/js/o'

初始化组件

//zyCapture ButtonclasszyCaptureBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyCapture.setEditor(this.editor).Capture();}tryChangeActive(){this.active()}}//zyOffice ButtonclassimportWordBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyOffice.SetEditor(this.editor).api.openDoc();}tryChangeActive(){this.active()}}//zyOffice ButtonclassexportWordBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyOffice.SetEditor(this.editor).api.exportWord();}tryChangeActive(){this.active()}}//zyOffice ButtonclassimportPdfBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){window.zyOffice.SetEditor(this.editor).api.openPdf();}tryChangeActive(){this.active()}}//WordPaster ButtonclassWordPasterBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).Paste();}tryChangeActive(){this.active()}}//wordImport ButtonclassWordImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importWord();}tryChangeActive(){this.active()}}//excelImport ButtonclassExcelImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importExcel();}tryChangeActive(){this.active()}}//ppt paster ButtonclassPPTImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importPPT();}tryChangeActive(){this.active()}}//pdf paster ButtonclassPDFImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor);WordPaster.getInstance().ImportPDF();}tryChangeActive(){this.active()}}//importWordToImg ButtonclassImportWordToImgBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor).importWordToImg();}tryChangeActive(){this.active()}}//network paster ButtonclassNetImportBtnextendsBtnMenu{constructor(editor){const$elem=E.$(`<div class="w-e-menu">`)super($elem,editor)}clickHandler(){WordPaster.getInstance().SetEditor(this.editor);WordPaster.getInstance().UploadNetImg();}tryChangeActive(){this.active()}}exportdefault{name:'HelloWorld',data(){return{msg:'Welcome to Your Vue.js App'}},mounted(){vareditor=newE('#editor');WordPaster.getInstance({//上传接口:http://www.ncmem.com/doc/view.aspx?id=d88b60a2b0204af1ba62fa66288203edPostUrl:"http://localhost:8891/upload.aspx",License2:"",//为图片地址增加域名:http://www.ncmem.com/doc/view.aspx?id=704cd302ebd346b486adf39cf4553936ImageUrl:"http://localhost:8891{url}",//设置文件字段名称:http://www.ncmem.com/doc/view.aspx?id=c3ad06c2ae31454cb418ceb2b8da7c45FileFieldName:"file",//提取图片地址:http://www.ncmem.com/doc/view.aspx?id=07e3f323d22d4571ad213441ab8530d1ImageMatch:''});zyCapture.getInstance({config:{PostUrl:"http://localhost:8891/upload.aspx",License2:'',FileFieldName:"file",Fields:{uname:"test"},ImageUrl:'http://localhost:8891{url}'}})// zyoffice,// 使用前请在服务端部署zyoffice,// http://www.ncmem.com/doc/view.aspx?id=82170058de824b5c86e2e666e5be319czyOffice.getInstance({word:'http://localhost:13710/zyoffice/word/convert',wordExport:'http://localhost:13710/zyoffice/word/export',pdf:'http://localhost:13710/zyoffice/pdf/upload'})// 注册菜单E.registerMenu("zyCaptureBtn",zyCaptureBtn)E.registerMenu("WordPasterBtn",WordPasterBtn)E.registerMenu("ImportWordToImgBtn",ImportWordToImgBtn)E.registerMenu("NetImportBtn",NetImportBtn)E.registerMenu("WordImportBtn",WordImportBtn)E.registerMenu("ExcelImportBtn",ExcelImportBtn)E.registerMenu("PPTImportBtn",PPTImportBtn)E.registerMenu("PDFImportBtn",PDFImportBtn)E.registerMenu("importWordBtn",importWordBtn)E.registerMenu("exportWordBtn",exportWordBtn)E.registerMenu("importPdfBtn",importPdfBtn)//挂载粘贴事件editor.txt.eventHooks.pasteEvents.length=0;editor.txt.eventHooks.pasteEvents.push(function(){WordPaster.getInstance().SetEditor(editor).Paste();e.preventDefault();});editor.create();varedt2=newE('#editor2');//挂载粘贴事件edt2.txt.eventHooks.pasteEvents.length=0;edt2.txt.eventHooks.pasteEvents.push(function(){WordPaster.getInstance().SetEditor(edt2).Paste();e.preventDefault();return;});edt2.create();}}h1,h2{font-weight:normal;}ul{list-style-type:none;padding:0;}li{display:inline-block;margin:010px;}a{color:#42b983;}

测试前请配置图片上传接口并测试成功
接口测试
接口返回JSON格式参考

为编辑器添加按钮

components:{Editor,Toolbar},data(){return{editor:null,html:'dd',toolbarConfig:{insertKeys:{index:0,keys:['zycapture','wordpaster','pptimport','pdfimport','netimg','importword','exportword','importpdf']}},editorConfig:{placeholder:''},mode:'default'// or 'simple'}},

整合效果

导入Word文档,支持doc,docx

导入Excel文档,支持xls,xlsx

粘贴Word

一键粘贴Word内容,自动上传Word中的图片,保留文字样式。

Word转图片

一键导入Word文件,并将Word文件转换成图片上传到服务器中。

导入PDF

一键导入PDF文件,并将PDF转换成图片上传到服务器中。

导入PPT

一键导入PPT文件,并将PPT转换成图片上传到服务器中。

上传网络图片

一键自动上传网络图片,自动下载远程服务器图片,自动上传远程服务器图片

下载示例

点击下载完整示例

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/21 7:54:46

dnSpy 终极指南:快速掌握.NET反编译与调试技巧

dnSpy 终极指南&#xff1a;快速掌握.NET反编译与调试技巧 【免费下载链接】dnSpy中文版下载 dnSpy 是一款功能强大的 .NET 反编译工具&#xff0c;适用于 Windows 操作系统。它能够帮助开发者轻松地反编译和调试 .NET 程序集&#xff0c;支持查看源代码、修改程序集、调试应用…

作者头像 李华
网站建设 2026/3/12 23:58:51

6、Raspberry Pi音频玩法大揭秘

Raspberry Pi音频玩法大揭秘 在当今的科技世界中,Raspberry Pi 以其强大的功能和丰富的扩展性成为了众多爱好者的宠儿。而在音频处理方面,Raspberry Pi 同样有着出色的表现。本文将为你详细介绍如何在 Raspberry Pi 上进行各种音频操作,包括安装音频代理、连接蓝牙设备、远…

作者头像 李华
网站建设 2026/3/18 10:48:17

UMAP降维与密度聚类深度融合:从流形学习到精准分群

UMAP降维与密度聚类深度融合&#xff1a;从流形学习到精准分群 【免费下载链接】umap Uniform Manifold Approximation and Projection 项目地址: https://gitcode.com/gh_mirrors/um/umap 在当今数据爆炸的时代&#xff0c;高维数据的有效聚类已成为机器学习领域的核心…

作者头像 李华
网站建设 2026/3/14 17:15:03

Linux shell进阶教程:sh和source调用子脚本的区别详解

在 Shell 脚本中&#xff0c;通过 sh 1.sh、bash 1.sh、source 1.sh 或 . 1.sh 调用子脚本&#xff0c;行为有本质区别&#xff0c;主要体现在 执行环境&#xff08;进程/作用域&#xff09; 和 变量/函数可见性 上。 ✅ 对比总结表 调用方式是否新建子进程能否修改父脚本变量…

作者头像 李华
网站建设 2026/3/12 23:59:17

ClusterGVis:基因表达矩阵的一键式聚类与可视化解决方案

ClusterGVis&#xff1a;基因表达矩阵的一键式聚类与可视化解决方案 【免费下载链接】ClusterGVis One-step to Cluster and Visualize Gene Expression Matrix 项目地址: https://gitcode.com/gh_mirrors/cl/ClusterGVis 在生物信息学研究中&#xff0c;时间序列基因表…

作者头像 李华