導航:首頁 > 文字圖片 > java讀取word文檔圖片

java讀取word文檔圖片

發布時間:2022-08-11 07:32:33

如何在java中讀取word文件

java讀取word文檔,獲取文本內容,保留基本的換行格式。

java用POI對word進行解析。所需jar包,用maven引入

<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>3.2-FINAL</version>
</dependency>

前端用webuploader上傳控制項,限制上傳文件類型僅支持text和word.

txt為word的文本內容

Ⅱ java 中用poi讀取word和用docx4j讀取word

不知道你是具體讀取Word裡面的什麼元素,下面以讀取文字和圖片為例吧,兩個代碼示例,你參考看看:

  1. 讀取文本

import com.spire.doc.Document;

import java.io.FileWriter;

import java.io.IOException;

public class ExtractText {

public static void main(String[] args) throws IOException {

//載入Word文檔
Document document = new Document();
document.loadFromFile("C:\Users\Administrator\Desktop\sample.docx");

//獲取文檔中的文本保存為String
String text=document.getText();

//將String寫入Txt文件
writeStringToTxt(text,"ExtractedText.txt");
}

public static void writeStringToTxt(String content, String txtFileName) throws IOException {

FileWriter fWriter= new FileWriter(txtFileName,true);
try {
fWriter.write(content);
}catch(IOException ex){
ex.printStackTrace();
}finally{
try{
fWriter.flush();
fWriter.close();
} catch (IOException ex) {
ex.printStackTrace();
}
}
}

}


2. 讀取圖片


import com.spire.doc.Document;

import com.spire.doc.documents.DocumentObjectType;

import com.spire.doc.fields.DocPicture;

import com.spire.doc.interfaces.ICompositeObject;

import com.spire.doc.interfaces.IDocumentObject;

import javax.imageio.ImageIO;

import java.awt.image.BufferedImage;

import java.io.File;

import java.io.IOException;

import java.util.ArrayList;

import java.util.LinkedList;

import java.util.List;

import java.util.Queue;

public class ExtractImages {

public static void main(String[] args) throws IOException {

//載入Word文檔

Document document = new Document();

document.loadFromFile("C:\Users\Administrator\Desktop\sample.docx");

//創建Queue對象

Queue nodes = new LinkedList();

nodes.add(document);

//創建List對象

List images = new ArrayList();

//遍歷文檔中的子對象

while (nodes.size() > 0) {

ICompositeObject node = nodes.poll();

for (int i = 0; i < node.getChildObjects().getCount(); i++) {

IDocumentObject child = node.getChildObjects().get(i);

if (child instanceof ICompositeObject) {

nodes.add((ICompositeObject) child);

//獲取圖片並添加到List

if (child.getDocumentObjectType() == DocumentObjectType.Picture) {

DocPicture picture = (DocPicture) child;

images.add(picture.getImage());

}

}

}

}

//將圖片保存為PNG格式文件

for (int i = 0; i < images.size(); i++) {

File file = new File(String.format("output/圖片-%d.png", i));

ImageIO.write(images.get(i), "PNG", file);

}

}

}

注意這里使用的jar包是spire.doc.jar,需要在java程序中先導入jar文件。

Ⅲ java想要對已有word文檔追加圖片,應該怎麼

以前做過其他office的沒做過微軟的,不過大同小異
這個你就需要在java中獲取到word的某種對象,方法有很多,但是要看你用什麼方式調用的office了,如果是某個牌子的中間件,那就用那個中間件的二次開發文檔裡面應該就有提到這些方法,如果是第三方的jar包,應該也不麻煩,通過jar包中的方法,可能要有一個word的實例創建的過程吧,然後獲取到range或者textrange等這些對象(應該是這倆對象……)通過這對象然後找到插入圖片的方法,然後傳入位置參數(可能是兩個數用逗號隔開)

Ⅳ java怎麼識別word內的圖片

這個問題和語言無關哦,你要用到 java 上解析 word 文件的第三方包來實現,有很多,搜索一下就好了。

Ⅳ 我想要實現的功能是用java讀取word中的自定義圖片

建議使用PageOffice很簡單就能實現這些。

Ⅵ 用java怎麼將word文檔轉成圖片格式

使用 java 操作 openoffice 實現格式轉換 辛苦了幾天。 不敢獨享成果

首先,要安裝 openoffice (廢話- -)
創建JAVA項目的時候 需要至少以下4個包

juh.jar,jurt.jar,ridl.jar,unoil.jar
以下是路徑
..\OpenOffice.org 2.3\program\classes

我只實現了我要的功能,就是把一種文件格式轉成另一種

Java代碼
package testh;

import java.io.*;
import com.sun.star.uno.UnoRuntime;

public class testcls {

public static void readdoc(String paths, String savepaths)
{
File d = new File(paths);
//取得當前文件夾下所有文件和目錄的列表
File lists[] = d.listFiles();
String pathss = new String("");

//對當前目錄下面所有文件進行檢索
for(int i = 0; i < lists.length; i ++)
{
if(lists[i].isFile())
{
String filename = lists[i].getName();
String filetype = new String("");
//取得文件類型
filetype = filename.substring((filename.length() - 3), filename.length());

//判斷是否為doc文件
if(filetype.equals("doc"))
{
System.out.println("當前正在檢索....");
//列印當前目錄路徑
System.out.println(paths);
//列印doc文件名
String fname=filename.substring(0, (filename.length() - 4));
System.out.println("檢索到文件"+fname);
try
{
//指定文件路徑和名稱
String path = savepaths+fname+".html";
File outfilename = new File(path);

/** *//**
* 檢查文件是否存在.
* @throws IOException
*
*/

if (!outfilename.exists()) {
System.err.println("目標路徑無同名文件,開始轉換");

System.out.print("正在轉換文件:"+fname);
Dump(paths,fname,savepaths);

}
else
{
System.out.print("文件已存在,放棄創建,請處理存在文件後再運行...\n");
continue;
}

RandomAccessFile mm = null;

}
catch(Exception e)
{
e.printStackTrace();
}
}

}

}

}

public static void Dump(String FilePath,String FileName,String OutPath)
{
com.sun.star.uno.XComponentContext xContext = null;

try {
// get the remote office component context
xContext = com.sun.star.comp.helper.Bootstrap.bootstrap();
System.out.println("Connected to a running office ...");

// get the remote office service manager
com.sun.star.lang.XMultiComponentFactory xMCF =
xContext.getServiceManager();

Object oDesktop = xMCF.createInstanceWithContext(
"com.sun.star.frame.Desktop", xContext);

com.sun.star.frame.XComponentLoader xCompLoader =
(com.sun.star.frame.XComponentLoader)
UnoRuntime.queryInterface(
com.sun.star.frame.XComponentLoader.class, oDesktop);

java.io.File sourceFile = new java.io.File(FilePath+FileName+".doc");//讀取的文件
StringBuffer sLoadUrl = new StringBuffer("file:///");
sLoadUrl.append(sourceFile.getCanonicalPath().replace('\\', '/'));

sourceFile = new java.io.File(OutPath+FileName+".html");//輸出的文件
System.out.print(OutPath+" "+FileName);
StringBuffer sSaveUrl = new StringBuffer("file:///");
sSaveUrl.append(sourceFile.getCanonicalPath().replace('\\', '/'));

com.sun.star.beans.PropertyValue[] propertyValue =
new com.sun.star.beans.PropertyValue[1];
propertyValue[0] = new com.sun.star.beans.PropertyValue();
propertyValue[0].Name = "Hidden";
propertyValue[0].Value = new Boolean(true);

Object oDocToStore = xCompLoader.loadComponentFromURL(
sLoadUrl.toString(), "_blank", 0, propertyValue );
com.sun.star.frame.XStorable xStorable =
(com.sun.star.frame.XStorable)UnoRuntime.queryInterface(
com.sun.star.frame.XStorable.class, oDocToStore );

propertyValue = new com.sun.star.beans.PropertyValue[ 2 ];
propertyValue[0] = new com.sun.star.beans.PropertyValue();
propertyValue[0].Name = "Overwrite";
propertyValue[0].Value = new Boolean(true);
propertyValue[1] = new com.sun.star.beans.PropertyValue();
propertyValue[1].Name = "FilterName";
propertyValue[1].Value = "HTML (StarWriter)";//你一定發現了,把這里改成其他參數,可以保存為不同的文件 MS Word 97,writer_pdf_Export
xStorable.storeAsURL( sSaveUrl.toString(), propertyValue );

System.out.println("\nDocument \"" + sLoadUrl + "\" saved under \"" +
sSaveUrl + "\"\n");

com.sun.star.util.XCloseable xCloseable = (com.sun.star.util.XCloseable)
UnoRuntime.queryInterface(com.sun.star.util.XCloseable.class,
oDocToStore );

if (xCloseable != null ) {
xCloseable.close(false);
} else
{
com.sun.star.lang.XComponent xComp = (com.sun.star.lang.XComponent)
UnoRuntime.queryInterface(
com.sun.star.lang.XComponent.class, oDocToStore );
xComp.dispose();
}
System.out.println("document closed!");
}
catch( Exception e ) {
e.printStackTrace(System.err);
System.exit(1);
}
}

public static void main(String args[]) throws Exception
{
String paths = new String("c:\\a\\");
String savepaths = new String ("f:\\");
readdoc(paths,savepaths);

}

}

Ⅶ 用Java從word中提取出圖片

因為太長了, 我放我空間了
思路是2003以後, word就可存為xml, 二進制數據按base64編碼
然後可以按解析xml文檔方式獲取圖片數據
然後對它進行解碼--

Ⅷ java:一個文件夾里裡面有很多圖片有很多word文件有我要如何讀取word文件名,該如何做

可以用過濾器,也可以循環自己判斷,如FourQueue 寫的那樣。
下邊是過濾器的例子。
------------------------------------------------------------------------------------
import java.io.File;
import java.io.FilenameFilter;

public class FileDoc {

public static void main(String[] args) {
File root = new File("D:\\test");
File[] files = root.listFiles(new FilenameFilter() {
public boolean accept(File dir, String name) {
if (name.toLowerCase().endsWith("doc")) {
// 2003 word
return true;
}
if (name.toLowerCase().endsWith("docx")) {
// 2007 word
return true;
}
return false;
}
});

for (int i = 0; i < files.length; i++) {
System.out.println(files[i].getPath());
}
}

}

Ⅸ java 讀取word 並識別圖片

肯定不是少引用了包,提示你類型不對。這個getImagedataArray這個方法,返回的是int類型,怎麼能用數組的方式去取值

Ⅹ 用java程序如何讀取word裡面的圖片

試試jacob,這個操作word的功能還是蠻多的。

閱讀全文

與java讀取word文檔圖片相關的資料

熱點內容
和平精英圖片環境天氣如何 瀏覽:566
微信里如何製作表情圖片 瀏覽:1
小溪面膜圖片大全 瀏覽:810
校園內景高清圖片動漫 瀏覽:201
小花仙的圖片高清壁紙 瀏覽:398
怎麼修改圖片的規格 瀏覽:281
2018男發型圖片 瀏覽:435
微雙下巴照片男生圖片 瀏覽:864
微博圖片如何看動圖 瀏覽:980
紋綉圖片怎麼拍好看 瀏覽:873
如何把word的圖片復制到文件夾 瀏覽:756
斜龐克發型圖片女生 瀏覽:802
word把圖片添加到單個頁眉 瀏覽:165
簡單彩繪草帽圖片大全 瀏覽:729
ps圖片怎麼減掉索引 瀏覽:646
美女肚子裡面圖片 瀏覽:460
蘿莉內褲動漫圖片大全 瀏覽:913
男生好看腿受傷圖片 瀏覽:338
紅色背景圖片可愛橫屏 瀏覽:152
女孩春晚涼鞋圖片 瀏覽:566