libs.utils.textutil module

libs/utils/textutil.py

class libs.utils.textutil.ConversionType

Bases: Enum

変換タイプ

HtoK = 3

ひらがなをカタカナに変換

HtoZ = 1

半角文字を全角文字に変換(数字のみ)

KtoH = 4

カタカナをひらがなに変換

ZtoH = 2

全角文字を半角文字に変換(数字のみ)

libs.utils.textutil.save_file_path(filename, delete=False)

保存ファイルのフルパスを取得

Parameters:
  • filename (str) – デフォルトファイル名

  • delete (bool, optional) – 生成済みファイルを削除. Defaults to False.

Returns:

保存ファイルパス

Return type:

Path

libs.utils.textutil.split_balanced(data, target_size, tolerance=0.15)

リストデータを指定個数で分割

Parameters:
  • data (list[list[Any]]) – 対象データ

  • target_size (int) – 分割サイズ

  • tolerance (float, optional) – 個数誤差. Defaults to 0.15.

Returns:

分割したリスト

Return type:

list[list[Any]]

libs.utils.textutil.split_text_blocks(text, limit=2000)

指定文字数でテキストを行単位で分割してリストにする

Parameters:
  • text (str) – 対象文字列

  • limit (int, optional) – 分割文字数. Defaults to 2000.

Returns:

分割リスト

Return type:

list[str]

libs.utils.textutil.str_conv(text, kind)

文字列変換

Parameters:
  • text (str) – 変換対象文字列

  • kind (ConversionType) – 変換種類

Returns:

変換後の文字列

Return type:

str