为什么使用 python 的 cassandra-driver 连接到 AWS keyspaces 这么慢?

Why is connecting to AWS keyspaces so slow with python's cassandra-driver?

我有一个 API,是一个 python 部署在 AWS EC2 上的烧瓶应用程序。某些端点需要连接到 AWS Keyspace 才能进行查询。但是方法 cluster.connect() 太慢了,连接需要 5 秒,然后 运行 查询。

我解决它的方法是在应用程序启动时启动连接(当在主分支上完成提交时,我使用的是 CodePipeline),然后连接一直打开。

我在 python cassandra 驱动程序文档中没有找到任何反对此的内容,我发现的这个解决方案是否存在任何潜在问题?

这是一种推荐的方式 - 在启动时打开连接并保持它(并且每个应用程序有一个连接)。打开与 Cassandra 集群的连接是一项代价高昂的操作,因为除了连接本身之外,驱动程序还会发现集群的拓扑结构、计算令牌范围以及许多其他事情。通常,对于“普通”Cassandra,这不应该很长(但仍然很昂贵),并且 AWS 的仿真可能会在其之上添加额外的延迟。

能否提供当前的连接配置?

Amazon Keyspaces 默认使用传输层安全 (TLS) 通信。如果您不提供连接证书,添加它可以帮助加快速度。有关完整示例,请查看 Keyspaces Python Sample

您也可以尝试禁用以下选项,这样可以更快地进行初始连接。

schema_metadata_enabled = False
token_metadata_enabled = False 

Python Driver Documentation

    from cassandra.cluster import Cluster
    from ssl import SSLContext, PROTOCOL_TLSv1_2 , CERT_REQUIRED
    from cassandra.auth import PlainTextAuthProvider
    import boto3
    from cassandra_sigv4.auth import SigV4AuthProvider
    
    ssl_context = SSLContext(PROTOCOL_TLSv1_2)
    ssl_context.load_verify_locations('path_to_file/sf-class2-root.crt')
    ssl_context.verify_mode = CERT_REQUIRED
    
    boto_session = boto3.Session()
    auth_provider = SigV4AuthProvider(boto_session)
    
    cluster = Cluster(['cassandra.us-east-2.amazonaws.com'], ssl_context=ssl_context, auth_provider=auth_provider,
                      port=9142)

    cluster.schema_metadata_enabled = False
    cluster.token_metadata_enabled = False 
    
    session = cluster.connect()
    r = session.execute('select * from system_schema.keyspaces')
    print(r.current_rows)