未检测到 Powerpoint 形状中的 C# 文本
C# Text in Powerpoint shape not being detected
我正在尝试提取 powerpoint 文件每张幻灯片中的所有文本。出于某种原因,我只收到一些文本,而不是全部。我正在遍历幻灯片中的所有形状并检查文本框和表格。但是一些带有文本的幻灯片将不会打印出任何内容。
这是只打印标题而没有其他文本的幻灯片的屏幕截图。
代码
foreach (PowerPoint.Slide _slide in pptPresentation.Slides) {
foreach(PowerPoint.Shape _shape in _slide.Shapes) {
//check for textframes
if (_shape.HasTextFrame == MsoTriState.msoTrue) {
var textFrame = _shape.TextFrame;
if (textFrame.HasText == MsoTriState.msoTrue) {
var textRange = textFrame.TextRange;
PrintAllParagraphs(textRange);
}
}
//check for tables
if(_shape.HasTable == MsoTriState.msoTrue) {
var slideTable = _shape.Table;
int rowCount = slideTable.Rows.Count;
int colCount = slideTable.Columns.Count;
for(int y = 1; y <= rowCount; y++) {
for(int x = 1; x <= colCount; x++) {
var tRange = slideTable.Cell(y, x).Shape.TextFrame.TextRange;
PrintAllParagraphs(tRange);
}
}
}
} //loop shapes
} //loop slides
打印函数
public void PrintAllParagraphs(PowerPoint.TextRange textRange) {
for (int i = 1; i <= textRange.Paragraphs().Count; i++) {
PowerPoint.BulletFormat bulletFormat = textRange.Paragraphs(i).ParagraphFormat.Bullet;
Console.WriteLine( (bulletFormat.Type == PowerPoint.PpBulletType.ppBulletNone) ? textRange.Paragraphs(i).Text.ToString() : "* " + textRange.Paragraphs(i).Text.ToString());
}
}
我还应该检查幻灯片形状中的其他内容吗?任何帮助,将不胜感激。谢谢
好的,事实证明这是一个 SmartArt,这就是检查 Shapes/Tables 没有检测到它的原因。
我所要做的就是循环 Smart Art 中的节点并从 TextRange 中获取文本。我注意到文本由“\r”分隔,所以通过拆分它我能够从中获得正确的输出。
//check for SmartArt
if(_shape.HasSmartArt == MsoTriState.msoTrue) {
foreach( SmartArtNode node in _shape.SmartArt.AllNodes) {
var txtRange = node.TextFrame2.TextRange;
var txt = txtRange.Paragraphs.Text.Split(new string[] { "\r" }, StringSplitOptions.None);
foreach(string line in txt)
Console.WriteLine(line);
}
}
我正在尝试提取 powerpoint 文件每张幻灯片中的所有文本。出于某种原因,我只收到一些文本,而不是全部。我正在遍历幻灯片中的所有形状并检查文本框和表格。但是一些带有文本的幻灯片将不会打印出任何内容。
这是只打印标题而没有其他文本的幻灯片的屏幕截图。
代码
foreach (PowerPoint.Slide _slide in pptPresentation.Slides) {
foreach(PowerPoint.Shape _shape in _slide.Shapes) {
//check for textframes
if (_shape.HasTextFrame == MsoTriState.msoTrue) {
var textFrame = _shape.TextFrame;
if (textFrame.HasText == MsoTriState.msoTrue) {
var textRange = textFrame.TextRange;
PrintAllParagraphs(textRange);
}
}
//check for tables
if(_shape.HasTable == MsoTriState.msoTrue) {
var slideTable = _shape.Table;
int rowCount = slideTable.Rows.Count;
int colCount = slideTable.Columns.Count;
for(int y = 1; y <= rowCount; y++) {
for(int x = 1; x <= colCount; x++) {
var tRange = slideTable.Cell(y, x).Shape.TextFrame.TextRange;
PrintAllParagraphs(tRange);
}
}
}
} //loop shapes
} //loop slides
打印函数
public void PrintAllParagraphs(PowerPoint.TextRange textRange) {
for (int i = 1; i <= textRange.Paragraphs().Count; i++) {
PowerPoint.BulletFormat bulletFormat = textRange.Paragraphs(i).ParagraphFormat.Bullet;
Console.WriteLine( (bulletFormat.Type == PowerPoint.PpBulletType.ppBulletNone) ? textRange.Paragraphs(i).Text.ToString() : "* " + textRange.Paragraphs(i).Text.ToString());
}
}
我还应该检查幻灯片形状中的其他内容吗?任何帮助,将不胜感激。谢谢
好的,事实证明这是一个 SmartArt,这就是检查 Shapes/Tables 没有检测到它的原因。
我所要做的就是循环 Smart Art 中的节点并从 TextRange 中获取文本。我注意到文本由“\r”分隔,所以通过拆分它我能够从中获得正确的输出。
//check for SmartArt
if(_shape.HasSmartArt == MsoTriState.msoTrue) {
foreach( SmartArtNode node in _shape.SmartArt.AllNodes) {
var txtRange = node.TextFrame2.TextRange;
var txt = txtRange.Paragraphs.Text.Split(new string[] { "\r" }, StringSplitOptions.None);
foreach(string line in txt)
Console.WriteLine(line);
}
}