リストのリスト

リストのリストをフラットなリストにする

from collections import Counter

# サンプルテキストを文書のリストとして表現
documents = [['a', 'b', 'c'], ['a', 'b', 'd']]

# 全ての文書にわたって単語をフラットなリストにする
words = [word for doc in documents for word in doc]

リストのリストをスペース区切りにする

  # 元の単語のリストのリスト
documents_list_of_lists = [['a', 'b', 'c'], ['a', 'b', 'd']]

# 各サブリストをスペース区切りの文字列に変換
documents = [' '.join(doc) for doc in documents_list_of_lists]

print(documents)  # 出力: ['a b c', 'a b d']

リストのリストから重複を削除する

  # 元のリストのリスト
documents_list_of_lists = [['a', 'b', 'c', 'a'], ['a', 'b', 'd', 'd']]

# 各サブリストから重複を削除しつつ順序を保持
unique_documents_ordered = [[x for i, x in enumerate(doc) if x not in doc[:i]] for doc in documents_list_of_lists]

print(unique_documents_ordered)  # 出力: [['a', 'b', 'c'], ['a', 'b', 'd']]

コメント