确定 perl 标量最初是否有一个或两个反斜杠

Determine if perl scalar originally had one backslash or two

我有从网络服务获取的数据。数据中有\\是有效的。数据中包含单个 \ 也是有效的。考虑以下对我的 perl 程序的有效数据输入。我不确定我如何确定哪些数据最初具有单个 \ 与双 \\。

$ cat data.pl
my $data ='=01=00=00=00=DF=FC=D3Y\=03';
my $data2='=01=00=00=00=DF=FC=D3Y\=03';
print $data;

注意上面代码中 $data 和 $data2 的唯一区别是 $data2 有一个额外的反斜杠。我也不想逃避反斜杠。反斜杠只是此数据流中的有效数据。两者都可以,并且发生在我的数据中。

调试会话:

$ perl -d data.pl

Loading DB routines from perl5db.pl version 1.37
Editor support available.

Enter h or 'h h' for help, or 'man perldebug' for more help.

main::(data.pl:1):      my $data='=01=00=00=00=DF=FC=D3Y\=03';
  DB<1> n
main::(data.pl:2):      my $data2='=01=00=00=00=DF=FC=D3Y\=03';
  DB<1> x $data
0  '=01=00=00=00=DF=FC=D3Y\=03'
  DB<2> p $data
=01=00=00=00=DF=FC=D3Y\=03
  DB<3> l
2==>    my $data2='=01=00=00=00=DF=FC=D3Y\=03';
3:      print $data;
  DB<3> n
main::(data.pl:3):      print $data;
  DB<3> x $data2
0  '=01=00=00=00=DF=FC=D3Y\=03'
  DB<4> p $data2
=01=00=00=00=DF=FC=D3Y\=03

因此,即使我的输入不同,Perl 仍将它们视为相同的数据,因为 \\ 是标量中的单个反斜杠,\ 也是。在赋值语句之后,对我来说似乎已经结束了。我不知道数据是否有 \\ 或 \.

似乎 perlio 层在某种程度上通过在反斜杠成为标量之前转义反斜杠来处理这个问题?对于进入我程序的数据,我不确定在何处正确转义 \。

数据从 HTTP 服务通过 LWP::UserAgent 流向最终出现在我的程序中的某些 perl 类。有没有办法在我的数据达到标量后处理这个 \\ vs \?

编辑

在 ikegami 的进一步研究和输入之后,我意识到这个问题现在很愚蠢,我对 perl 中如何转义反斜杠感到困惑。任何接受输入的东西都会转义反斜杠,以便它可以在 perl 中正确表示。在我的情况下,我在数据路径上丢失了一些对我来说不明显的反斜杠。

$ perl -d data.pl

Loading DB routines from perl5db.pl version 1.37
Editor support available.

Enter h or 'h h' for help, or 'man perldebug' for more help.

main::(data.pl:5):      my $data='{ "data": "=01=00=00=00=DF=FC=D3Y\\=03" }';
  DB<1> n
main::(data.pl:6):      my $decoded = decode_json($data);
  DB<2> x $decoded
0  HASH(0x175fcf8)
   'data' => '=01=00=00=00=DF=FC=D3Y\=03'

就我而言,我必须重新转义经过 json_decode 的反斜杠。

鉴于最初的问题很愚蠢,而且我们现在处于非常具体的领域,我会关闭这个问题。

谢谢。

您似乎认为 my $data1 = '=01=00=00=00=DF=FC=D3Y\=03';'=01=00=00=00=DF=FC=D3Y\=03' 放在标量中,但这是完全错误的。

字符串文字(即代码段)'=01=00=00=00=DF=FC=D3Y\=03' 的计算结果为字符串 =01=00=00=00=DF=FC=D3Y\=03。赋值将该字符串放在标量中。

同样,字符串文字 '=01=00=00=00=DF=FC=D3Y\=03' 的计算结果为字符串 =01=00=00=00=DF=FC=D3Y\=03。赋值将该字符串放在标量中。

类似地,<$fh> 的计算结果为字符串 =01=00=00=00=DF=FC=D3Y\=03(当从包含 =01=00=00=00=DF=FC=D3Y\=03 的文件中读取时)。赋值将该字符串放在标量中。

无法判断是这些代码中的哪一段生成了字符串。


So even though my inputs were different, perl considers them both the same data due to fact that \ is a single backslash in a scalar and so is \.

这毫无意义。在你的例子中没有输入,Perl 也没有做任何事情 "considering"。您只需拥有两段等效的代码。


Data flows from an HTTP service through LWP::UserAgent to some perl classes that eventually end up in my program. Is there a way to deal with this \ vs \ in my data after it gets to a scalar?

LWP::UserAgent 将提供服务器返回的内容。它不会执行您所描述的那种转换。

控制台 1:

$ nc -l 8888 <<'.'
HTTP/1.1 200 OK
Content-Type: text/plain

=01=00=00=00=DF=FC=D3Y\=03
=01=00=00=00=DF=FC=D3Y\=03
.

控制台 2:

$ perl -MLWP::UserAgent -e'print LWP::UserAgent->new->get("http://localhost:8888")->content'
=01=00=00=00=DF=FC=D3Y\=03
=01=00=00=00=DF=FC=D3Y\=03