Linux Q&A に質問

後でテキストを処理するためにPDFリーダーが読み取ったテキストを文字列として保存できるツールを作成することは可能ですか？

linux

bash

text-processing

python

pdf

後でテキストを処理するためにPDFリーダーが読み取ったテキストを文字列として保存できるツールを作成することは可能ですか？

Linux Mintには、オペレーティングシステムと共にデフォルトでインストールされる「Xreader」というPDF読み取りツールがあります。マウスの左ボタンクリックでテキストを選択すると、読み込んだテキストをBashまたはPython文字列に保存して、保存したテキストをBashおよび/またはPythonツールを使用して処理できるツールを作成できますか？ Linux Mintには、そのようなことを達成するために使用できる「メカニズム」がありますか？言う。 PDFリーダー（Xreaderなど）で開いたPDFから受け取ったテキストを処理できるPythonスクリプトを作成しようとしています。 PDFリーダーを介してPDFファイルを開きます。マウスカーソルを使って興味のあるテキストを選択します。テキストをインポートしたがすでに処理した結果、たとえば不要なスペースを削除して翻訳を行った場合その結果、添付のグラフィックウィンドウにテキストがマッピングされます。

Admin 2024-08-10

python

python3

RHEL 8.4用のPython 3.7 rpmを見つけるのに助けが必要です。

RHEL 8.4にはPython 3.7 rpmが必要ですが、Pythonの公式ウェブサイトにはありません。リンクを共有したり、このrpmをダウンロードできる場所をリダイレクトしてください。 3.7カーネルに同梱するには、このrpmがCDSW 1.10.2として必要となるため、pyspark（Spark 2.4）で作業するには、すべてのデータノードにPython 3.7をインストールする必要があります。ありがとうございます！

Admin 2024-08-20

python

netcat

「ncat」は、Pythonスクリプトで実行すると、リダイレクトを（追加）ポート仕様として扱います。

Pythonスクリプトでは、次のようにファイルを受信して受信するサブプロセスを実行しようとしていますncat。 proc = subprocess.Popen(command,stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE) command変数は次のリストです。 command = ['nc', '-4', '-l', '10099', '>', '/tmp/files/copy_file_2_10099'] エラーが発生します。 Ncat: Got more than one port specification: 10000 > *path to file* >とパス文字列をポート番号として扱うようです。どんなアイデアがありますか？

Admin 2024-08-23

linux

cron

python

crontabでPythonスクリプトは実行されません。

一般ユーザーとしてログインし、RHEL8で毎分実行するようにcronジョブをスケジュールします。 Pythonスクリプトは端末で./python.pyとして実行すると正しく実行されますが、crontabでジョブとして実行するとエラーが発生します。以下は、「which python3」と「realpath -e python.py」で得られた絶対パスです。 python.py chmod 777 権限を付与します。クローンタップ-e * * * * * /usr/bin/python3 /home/user/test_1/test/python.py >> /home/user/test_1/test/cron.log 2>&1 間違い： Traceback (most recent call last): File "/home/user/test_1/test/python.py", line 127, in log_location = config.log_file_location() File "/home/user/test_1/test/config.py", line 62, in log_file_location baseLoc = self.base_data_location() File "/home/user/test_1/test/config.py", line 56, in base_data_location baseDirPath = self.cb_config.get('base_data_dir', '/tmp') AttributeError: 'NoneType' object has no attribute 'get' Exception reading config: No section: 'test_connection' Exception reading config: No section: 'product_info' Exception reading config: No section: 'event_ids

Admin 2024-08-16

ubuntu

python

path

Python拡張をインストールしようとすると、「PATHにはありません」という警告が表示されます。私はLinuxを初めて使用します。これはどういう意味ですか？

vscode に Python 拡張機能を追加しようとすると、一部の拡張機能が欠落していると表示され (?)、自動的に次のコマンドを入力するように求められます。/bin/python3 /home/myusername/.vscode/extensions/ms-python.python-2020.9.112786/pythonFiles/pyvsc-run-isolated.py pip install -U pylint --user ただし、端末で実行した後、インストールは成功しましたが、次のように表示されます。 WARNING: The script isort is installed in '/home/myusername/.local/bin' which is not on PATH. これは深刻な問題ですか？どうすればいいですか？

Admin 2024-08-18

ubuntu

python

コードの最適化

以下に私のコード（私が作成したメソッド）の一部を示します。読みやすさを向上させ、より美しくするための提案があるかどうかを尋ねたいです。だから私がしたことは、Excelファイルを読んでその内容を元にしたことでした。展示する列はデータベースでいくつかのクエリを実行しました。しかし、私の問題は三項演算子にあります。この演算子は多く使用され、ひどいようです。 def add_new_patient_identifier(self, excel_file, sheet): patient_identifiers = self.excel_reader.read_excel_sheet(excel_file, sheet) header = self.excel_reader.get_header(patient_identifiers) self.openmrsclient_db.execute("DELETE FROM idgen_identifier_source") self.openmrsclient_db.execute("DELETE FROM idgen_seq_id_gen") for identifier in patient_identifiers.iter_rows(min_row=2): if identifier[header['Display']].value == "Yes": field = str(identifier[header['Field']].value) if str(identifier[header['Field']].value) != 'None' else '' description = str(identifier[header['Source Description']].value) if str(identifier[header['Source Description']].value) != 'None' else '' next_sequence_value = str(identifier[header['Next Sequence Value']].value) if str(identifier[header['Next Sequence Value']].value) != 'None' else '' base_character_set = str(identifier[header['Base Character Set']].value) if str(identifier[header['Base Character Set']].value) != 'None' else '' first_identifier_base = str(identifier[header['First Identifier Base']].value) if str(identifier[header['First Identifier Base']].value) != 'None' else '' suffix = str(identifier[header['Suffix']].value) if str(identifier[header['Suffix']].value) != 'None' else '' min_length = str(identifier[header['Min Length']].value) if str(identifier[header['Min Length']].value) != 'None' else '' max_length = str(identifier[header['Max Length']].value) if str(identifier[header['Max Length']].value) != 'None' else '' type_identifier = str(identifier[header['Type']].value) if str(identifier[header['Type']].value) != 'None' else '' identifier_type_id = str(self.openmrsclient_db.fetch( "SELECT patient_identifier_type_id FROM patient_identifier_type WHERE name = '" + type_identifier + "'")[0][0]) self.openmrsclient_db.execute("INSERT INTO idgen_identifier_source (uuid, name, description, identifier_type, date_created, creator) \ VALUES (uuid(),'" + field + "', '" + description + "', '" + identifier_type_id + "', now(), '1')") identifier_source_id = str(self.openmrsclient_db.fetch("SELECT id FROM idgen_identifier_source WHERE name = '" + field + "'")[0][0]) self.openmrsclient_db.execute("INSERT INTO idgen_seq_id_gen (id, next_sequence_value, base_character_set, first_identifier_base, prefix, suffix, min_length, max_length) \ VALUES (" + identifier_source_id + "," + next_sequence_value + "," + base_character_set+","+first_identifier_base+",'" + field+"','"+suffix+"'," + min_length + "," + max_length + ")")

Admin 2024-08-20

bash

text-processing

python

ファイルの各列で特定の数の発生回数を計算する方法は？

負のリストを含むtxtファイルと3つの数値列を含むcsvファイルがあります。 csvファイル内のすべての数字はtxtファイルに含まれ、txtファイルにはcsvファイル内の数字のみが含まれます。以下は簡単な例です。 cat list.txt -14.5 -12.3 -10.1 -10.0 -9.9 -9.8 -7.3 -0.1 cat numbers.csv -14.5,-14.5,-12.3 -14.5,-12.3,-10.1 -10.0,-9.9,-10.1 -7.3,-9.8,-10.1 -7.3,-7.3,-10.1 -0.1,-0.1,-9.8 list.txt各列に各数字が何回表示されるかを知る必要がありますnumbers.csv。上記の例で予想される結果は次のとおりです。 -14.5: 2,1,0 -12.3: 0,1,1 -10.1: 0,0,4 -10.0: 1,0,0 -9.9: 0,1,0 -9.8: 0,1,1 -7.3: 2,1,0 -0.1: 1,1,0 見つけることができるショートカットがありますか？私はbashとpythonの初心者です。

Admin 2024-08-12

software-installation

python

python3

pip

これらのインポートのためにpipとしてインストールするPythonモジュールをどのように決定しますか？

いくつかの添え字を使用していくつかのスクリプトを実行しようとしていますが、各スクリプトはいくつかのインポートを実行します。全体として、次のようになります（fromドットで始まるパラメータを削除します）。 from datetime import datetime from pathlib import Path from timeit import default_timer as timer from tkinter import * from tkinter import messagebox from tkinter.filedialog import askdirectory from tkinter.filedialog import askopenfilename import abc import argparse import copy import csv import json import os import re import time import xlsxwriter import yaml pipを使用して、これらのインポートが機能するために必要なモジュールをインストールしようとしています。つまり、以下を実行したいと思います。 python3 -m pip install foo bar baz whatever モデルを実行するために必要なすべてを備えています。たとえば、 python3 -m pip search yaml 多くのモジュールがありますが、その中に単に名前が付けられたモジュールはありませんyaml。 1つがありますが、yaml-1.3それが私に必要なものであることを100％確信することはできませんxlsxwriter。だから私の質問は：上記のインポートのためにどのモジュール名をインストールする必要があるかをどのように決定しますか？

Admin 2024-08-16

Red Hat Enterprise Linux Workstationバージョン6.7（Santiago）にyumをインストールする方法は？

rhel

package-management

python

yum

Red Hat Enterprise Linux Workstationバージョン6.7（Santiago）にyumをインストールする方法は？

yumを使用していくつかのパッケージをインストールしようとしていますが、yumはインストールされません。 $ yum install There was a problem importing one of the Python modules required to run yum. The error leading to this problem was: No module named yum Please install a package which provides this module, or verify that the module is installed correctly. It's possible that the above module doesn't match the current version of Python, which is: 2.7.10 (default, Jun 12 2015, 16:19:57) [GCC 4.4.7 20120313 (Red Hat 4.4.7-11)] If you cannot solve this problem yourself, please go to the yum faq at: http://yum.baseurl.org/wiki/Faq

Admin 2024-08-13

検索パターンと一致し、Pythonプログラムへの順次入力として機能するGlobファイル

linux

ubuntu

find

python

検索パターンと一致し、Pythonプログラムへの順次入力として機能するGlobファイル

"ls"の後には次のディレクトリがあります。 08-21-resume-numrelblocks3-nqh2-numblocks2-stackonlyFalse-dockimgnegativereward-gpfg-uniformxy 08-22-32-nqh2-alpha-stack1-stack2-numrelblocks3-nqh2-dockimgnegativereward-gpfg-uniformxy-epsgreedyprobaction0.1-stackonlyFalse-SNA-Truemultihead-nonlinearitybeforeattn 08-22-6-12-alpha-stack11-stack12-numrelblocks3-nqh1-dockimgnegativereward-gpfg-multitower4-epsgreedyprobaction0.1-stackonlyTrue-GAT-Truemultihead-nonlinearitybeforeattn 08-22-alpha-stack5-stack6-numrelblocks3-nqh1-dockimgnegativereward-gpfg-multitower3-epsgreedyprobaction0.1-stackonlyTrue-GAT-Truemultihead-nonlinearitybeforeattn 08-23-alpha-stack6-stack9-numrelblocks3-nqh1-dockimgnegativereward-gpfg-multitower3-epsgreedyprobaction0.1-stackonlyTrue-SNA-Truemultihead 08-23-lstmcell-alpha-stack1-numrelblocks1-nqh1-dockimgnegativereward-gpfg-uniformxy-SpatialNeighborhoodAttention-Truemultihead-Falsestackonly-praFalse-qcmFalse 私のプログラムExecution.pyに日付08-22のディレクトリを入力する必要があります。例えば python execute.py 08-22-32-nqh2-alpha-stack1-stack2-numrelblocks3-nqh2-dockimgnegativereward-gpfg-uniformxy-epsgreedyprobaction0.1-stackonlyFalse-SNA-Truemultihead-nonlinearitybeforeattn 08-22-6-12-alpha-stack11-stack12-numrelblocks3-nqh1-dockimgnegativereward-gpfg-multitower4-epsgreedyprobaction0.1-stackonlyTrue-GAT-Truemultihead-nonlinearitybeforeattn 08-22-alpha-stack5-stack6-numrelblocks3-nqh1-dockimgnegativereward-gpfg-multitower3-epsgreedyprobaction0.1-stackonlyTrue-GAT-Truemultihead-nonlinearitybeforeattn 各行を個別にコピーして貼り付ける手間をかけずにこれを行うにはどうすればよいですか？

Admin 2024-08-16

他のファイルのパターンと一致するファイルの複数行にある複数の部分文字列を置き換える方法は？

shell-script

awk

sed

python

perl

他のファイルのパターンと一致するファイルの複数行にある複数の部分文字列を置き換える方法は？

複数のIPアドレスとホスト名を含むファイルと、1行に複数のIPアドレスを持ついくつかのフォルダを含む他のファイルがあります。 IP_ホスト名.txt host1 10.1.1.1 host2 10.2.2.2 host3 10.3.3.3 host100 10.50.50.50 path_ips.txt /path1/foo/bar 10.1.1.1 10.2.2.2 10.3.3.3 /path2/foo/bar 10.3.3.3 10.7.7.7 /path3/foo/bar 10.4.4.4 10.8.8.8 10.29.29.29 10.75.75.75 /path100/foo/bar 10.60.60.60 IPアドレスを変更したいpath_ips.txtホスト名が出るファイルIP_ホスト名.txt各 IP アドレスに一致するファイルです。希望の出力path_ips.txt /path1/foo/bar host1 host2 host3 /path2/foo/bar host3 host7 /path3/foo/bar host4 host8 host29 host75 /path100/foo/bar host60 私は入れ子になったsedを使ってこれを試しました。読みながらループは次のとおりです。 #!/bin/sh while read -r line do IP=$(echo $line| awk '{print $1}') HN=$(echo $line| awk '{print $2}') while read -r line2 do sed -i "s/$IP/$HN/g" path_ips.txt echo $line2 #to see the progress done < path_ips.txt done < ip_hostname.txt IPアドレスとホスト名のリストがそれほど大きくない場合は、最初はうまく機能しますが、より大きなリストを使用しようとするとうまく機能します。IP_ホスト名.txtファイルを開くと奇妙に動作し、結果が予想と異なります。言うまでもなく完了するのに長い時間がかかります。これを行うより良い効率的な方法はありますか？

Admin 2024-09-05

最新記事