Google 语言 API 如何将文本拆分成句子来分配情绪?

How does Google Language API split text into sentences to assign sentiment?

问题在标题里

我将句子连接成一个大文本,然后调用 analyze_sentiment。目标是为单个句子拉动情绪——正是最初加入的句子。

我先把标点符号全部清理掉,lower个字,capitalize个句子,.结尾,join结尾一个space。

这里有两个句子的例子,Google 认为是一个句子。

She answered my questions with ease Thx. Tyler was so considerate.

然而,

She answered my questions with ease Thx. Sam was so considerate.

工作正常。

您可以前往他们的 natural-language page 并尝试 API.

来自己尝试

如果我知道拆分条件,我可以相应地格式化我的原始句子。

句子边界模型似乎变得混乱了。我将从 Google 方面为此打开一个错误。

如果您需要为每个句子寻找情绪,您可以将句子单独发送到 API,这样句子边界问题就不会妨碍您。您是否为了节省配额或计费或延迟而连接句子?因为就模型的工作原理和情感分数的计算而言,单独发送句子与一大块发送句子没有区别。