CoreData 和最常见的单词 used/tagged

CoreData and the most common word used/tagged

我有一个类似于此站点上 "tags" 功能的输入字段:用户输入一堆单词或短语,这些单词或短语会显示在他们自己的气泡中。这些 words/phrases 与日记条目相关联(基本上是标记日记条目),在概览页面上我想显示其中的前 5 或 10 个 words/phrases。

我最初的实现是在每个日记条目中存储一个字符串,基本上连接所有这些 words/phrases。当我读取数据时,我根据预定义的分隔符拆分了这个字符串。这非常有效,但如果我有很多条目包含相当数量的 words/phrases,那么找到前 5/10 将非常糟糕。什么是更好的方法?

所以,我有这样的东西:

@interface JournalEntry : NSManagedObject
{
     @property (nonatomic, retain) NSNumber * entryId;
     @property (nonatomic, retain) NSDate * dateCreated;
     @property (nonatomic, retain) TagsInfo *tagsInfo;
}

@interface TagsInfo : NSManagedObject
{
     @property (nonatomic, retain) JournalEntry * journalEntry;
     @property (nonatomic, retain) NSString * tagString;
}

我想在正常的数据库设置中,我会为标签创建一个 table,我会在其中存储 [journalEntryId,tagEntry] 之类的东西。每个日记条目都会有一堆这样的条目。这应该是相似的吧?

这就是我要做的,创建一个与 JournalEntry 具有多对多关系的新 Tag 实体。将现有 TagInfo 迁移到 Tag 并更新关系。

Tag 将至少具有以下内容:

  • JournalEntry
  • 的一对多关系
  • 字符串名为 tagString(或 tagName 或其他)。

JournalEntryTag 之间存在一对多关系。 tagString 是唯一的,因为每个 Tag 可能与多个日记条目相关。

然后您可以获取标签以及每个标签被使用的次数,如下所示:

NSExpression *tagCountExpression = [NSExpression expressionWithFormat:@"count(journalEntries)"];
NSExpressionDescription *tagCountExprDescription = [[NSExpressionDescription alloc] init];
tagCountExprDescription.name = @"count";
tagCountExprDescription.expression = tagCountExpression;
tagCountExprDescription.expressionResultType = NSInteger64AttributeType;

NSFetchRequest *tagFetch = [NSFetchRequest fetchRequestWithEntityName:@"Tag"];
[tagFetch setResultType:NSDictionaryResultType];
tagFetch.propertiesToFetch = @[ @"tagString", tagCountExprDescription ];
tagFetch.propertiesToGroupBy = @[ @"tagString" ];

这将为您提供一组字典。每个都包含一个 tagString 和一个 count,表示该标签有多少相关的日记条目。您必须自己对其进行排序(不能使用表达式作为排序描述符)。