在 php 中读取 docx 文件时删除空行
Removing empty line when reading docx file in php
开始之前..我对PHP很陌生...希望您能耐心等待。
我有一个句子文件(.docx 类型),我将在有句点的地方拆分这些句子。
我使用的代码是:
$docObj = new Filetotext($fileToTest);
$docextracted = $docObj->extractText();
// pattern to find the fullstop
$pattern = '/\./';
//giving a new line to each sentence
$current1= preg_replace($pattern, "\r\n", $docextracted);
$splitArray = explode("\n", $current1);
//$mainFile = $splitArray;
$mainFile = (str_replace(' ', '', $splitArray));
print_r($mainFile);
该文件实际包含以下内容:(仅供示例)
This is a test file. The purpose of this test file is to ensure that the file reading part is working. This test is important. This test ends here.
但是当 print_r($mainFile);
给出以下内容时:
Array
(
[0] =>
[1] => Thisisatestfile
[2] => Thepurposeofthistestfileistoensurethatthefilereadingpartisworking
[3] => Thistestisimportant
[4] => Thistestendshere
[5] =>
)
第一个和最后一个数组索引中的空部分(忘了这个词)是问题所在。我尝试了其他文件和同样的事情。第一个和最后一个索引为空。当我试图对此设置一个计数器时,或者当我试图将数组与其他数组进行比较时,这会导致问题。
我的代码有什么问题导致空的部分吗?
非常感谢任何形式的帮助:)
在 $current1 上执行 trim 以删除前后的空格,在 explode() 之前,应该可以解决问题。
....
$current1 = trim($current1);
$splitArray = explode("\n", $current1);
....
开始之前..我对PHP很陌生...希望您能耐心等待。
我有一个句子文件(.docx 类型),我将在有句点的地方拆分这些句子。
我使用的代码是:
$docObj = new Filetotext($fileToTest);
$docextracted = $docObj->extractText();
// pattern to find the fullstop
$pattern = '/\./';
//giving a new line to each sentence
$current1= preg_replace($pattern, "\r\n", $docextracted);
$splitArray = explode("\n", $current1);
//$mainFile = $splitArray;
$mainFile = (str_replace(' ', '', $splitArray));
print_r($mainFile);
该文件实际包含以下内容:(仅供示例)
This is a test file. The purpose of this test file is to ensure that the file reading part is working. This test is important. This test ends here.
但是当 print_r($mainFile);
给出以下内容时:
Array
(
[0] =>
[1] => Thisisatestfile
[2] => Thepurposeofthistestfileistoensurethatthefilereadingpartisworking
[3] => Thistestisimportant
[4] => Thistestendshere
[5] =>
)
第一个和最后一个数组索引中的空部分(忘了这个词)是问题所在。我尝试了其他文件和同样的事情。第一个和最后一个索引为空。当我试图对此设置一个计数器时,或者当我试图将数组与其他数组进行比较时,这会导致问题。
我的代码有什么问题导致空的部分吗?
非常感谢任何形式的帮助:)
在 $current1 上执行 trim 以删除前后的空格,在 explode() 之前,应该可以解决问题。
....
$current1 = trim($current1);
$splitArray = explode("\n", $current1);
....