リストのリストをフラットなリストにする
from collections import Counter
# サンプルテキストを文書のリストとして表現
documents = [['a', 'b', 'c'], ['a', 'b', 'd']]
# 全ての文書にわたって単語をフラットなリストにする
words = [word for doc in documents for word in doc]
リストのリストをスペース区切りにする
# 元の単語のリストのリスト
documents_list_of_lists = [['a', 'b', 'c'], ['a', 'b', 'd']]
# 各サブリストをスペース区切りの文字列に変換
documents = [' '.join(doc) for doc in documents_list_of_lists]
print(documents) # 出力: ['a b c', 'a b d']
リストのリストから重複を削除する
# 元のリストのリスト
documents_list_of_lists = [['a', 'b', 'c', 'a'], ['a', 'b', 'd', 'd']]
# 各サブリストから重複を削除しつつ順序を保持
unique_documents_ordered = [[x for i, x in enumerate(doc) if x not in doc[:i]] for doc in documents_list_of_lists]
print(unique_documents_ordered) # 出力: [['a', 'b', 'c'], ['a', 'b', 'd']]
コメント
コメントを投稿