拆分并仅保留存储在 python 数据框列中的英文文本

split and retain only text in english that is stored in a column in python dataframe

我有一个数据框“app_final”,其中一列“text_content”包含多种语言的文本。我只想保留该列中的英文文本。任何想法我应该怎么做?

我尝试使用以下 python 代码通过 langdetect 将每个文本中的每个单词 运行 创建一个新列“english_text”,仅将英文单词添加到新列但是,我收到错误消息“LangDetectException:文本中没有功能。” 我还应该如何处理这个问题?

for i in range(0,len(app_final['text_content'])):
    for x in range(0,len(app_final['text_content'][i].split())):
        english=[]
        language=detect(app_final['text_content'][i].split()[x])
        eng_text=np.where(language=='en',app_final['text_content'][i].split()[x],np.NaN)
        english.append(eng_text)
    app_final['english_text']=english

这是我试图仅提取英文文本的记录的一个示例:

print(app_final['text_content'][635])

LINE推送消息的分段发送是可能的。通过使用过滤器,您可以将消息发送到除 LINE 官方帐户可以发送的段之外的您自己的段。通过缩小消息发送目的地,还可以节省LINE官方账号的费用。使用LINE,您可以创建高度自由的丰富菜单。可以在LINE官方账号上自由度高地制作丰富的菜单。支持9分12分等不规则设计,默认不支持,比如只显示推荐商品和网页的大链接。 LINE talk 收藏品一并显示现在可以在LINE talk 展示收藏品信息。可以一次性向用户推荐销售和推荐等独特的收藏。通过LINE官方账号提高购买率。根据用户属性的特殊丰富菜单显示和推送消息传递 Kisuke 是一种可以利用 LINE 作为新销售渠道的 EC 管理服务。可以对LINE公众号的好友进行分群投递消息。此外,可以自由度高地分发丰富的菜单。可以发布无法在 LINE 上发布的丰富菜单。

对于无法有效利用LINE官方账号进行营销的电商企业来说,这是最好的选择。 喜助的主要特征 1.推送通知(LINE消息传递) 通过与 Shopify 的链接,可以同时向不同的用户群发送匹配消息,例如“可能更换特定产品的人”和“在订购时放弃网站的用户”。

2.丰富的菜单投放 如果您使用具有自定义图像布局模式和链接区域功能的 Kisuke,您可以尝试各种图像布局和设置按钮。还可以发布LINE官方账号不支持的丰富菜单模式。 例如,你可以像这样使用它...... 1. 向放弃购物车的用户发送限时优惠券... 1 小时优惠券也很有效,因为消息被识别的时间比通过电子邮件发送更短。 配合2.Shopify过滤器,向1个月前购买过消耗品的用户发送重复购买信息,促进重复购买。 可以根据细分用户的需求进行消息传递。

我们期待您的问题和要求。 关于使用、定制要求等,请随时与我们联系。

Kisuke是一个EC管理服务,可以把LINE作为一个新的销售渠道。LINE公众号好友可以分段发送消息。另外,可以分发自由度高的丰富菜单。那不能用LINE分发可以分发。

对于没有使用LINE官方账号进行营销的EC企业来说,这是最好的选择。 Kisuke的主要功能

推送通知(LINE消息传递) 通过与 Shopify 合作,可以向不同细分市场的用户广播匹配的消息,例如“何时购买特定产品”或“在订购时退出网站的用户”它变成了。 丰富的菜单配送 Kisuke有图片布局模式和link区域自定义功能,可以尝试各种图片布局和设置按钮,LINE公众号不支持的丰富菜单模式也可以分发。

由于您的文本被分成了段落,您可以尝试使用 Polyglot 检测其中一段是否为英文。 https://polyglot.readthedocs.io/en/latest/Installation.html

由于你的日语文本中有英文单词,你应该在段落中使用最可能的语言。例如:

from polyglot.detect import Detector

text = u"""
2.リッチメニュー配信 画像の配置パターンやリンクエリアのカスタマイズ機能があるKisukeを使えば、様々な画像配置を試すことができ、ボタンの設置等も可能となります。LINE公式アカウントでは対応していないリッチメニューのパターンも配信可能です。 例えばこんな使い方も… 1.カゴ落ちユーザに期間限定割引クーポンを送信…メールで送るより短時間でメッセージが認識されるため、1時間限定クーポンも有効です。 2.Shopifyのフィルターと連携して、1か月前に消耗品を買ったユーザにリピート促進メッセージを送信して、リピート購入を進める。 など細分化したユーザの需要に応じてメッセージ配信が可能になります。
"""

if Detector(text).languages[0].name == 'Japanese':
    do nothing
elif Detector(text).languages[0].name == 'English':
    append into string

对每个段落重复该过程,然后用您制作的仅保留英文段落的新单元格替换该单元格。