为解析 JSON 字符串的递归调用获取正确的子序列
Get the right subsequence for the recursive call parsing a JSON string
我开始编写下面的代码作为大学作业,其中包括在 Common Lisp 中解析 json 字符串。我现在面临的主要问题是获得正确的 substring\subsequence 以继续递归调用并解析字符串的其余部分。基本上主要思想是递归检查整个字符串。按照给定的语法,输入字符串应为:
1) "{\"nome\" : \"arturo\" , \"cognome\" : \"durone\" , \"età\" : \"22\" , \"corso\" : \"informatica\"}"
2) "{\"name\" : \"Zaphod\",\"heads\" : [[\"Head1\"], [\"Head2\"]]}"
3) "{\"name\" : \"Zaphod\",{property:value, property : [1,2,3] }
4) "[1,2,3]"
基本上我确实从字符串中删除任何 space 和任何 \" 得到一个干净的字符串 "{name:Zaphod,heads:[[Head1],[Head2]]}"
,在这里我检查 ':'
的位置并获取从 0 到((position ":")-1)
,第二部分也一样,但是当我必须传递给递归调用时,问题就来了,因为我不知道如何传递字符串的正确索引。
我试图检查函数在输出中给我的新列表的任何元素的长度,但它没有 work/help 因为字符串被拆分并且没有 space和初始输入中的 \"
个字符。你能帮我找到一种方法来按照递归方法解析 json 字符串的其余部分吗?
> main function
(defun j-obj (str)
(cond ((correct_form str)
`(json-obj-aux(revome_braces (remove_backslash(remove_space str)))))))`
> aux function that thru a recursive call analize the whole string
(defun json-obj-aux (str)
(cond ((= (length str) 0)nil)
((cons (aux_control str)nil))))
; (json-obj-aux (subseq (shorter str)(length (aux_control (shorter str)))
; (length (shorter str))))))))
> check the whole string , splitting once it finds ":"
(defun aux_control (str)
(cons (subseq str 0 (search ":" str))(check_type (subseq str (+ (search ":" str) 1) (length str)))))
(defun check_type (str)
(cond ((equal (subseq str 0 1) "{")(obj_c str))
((equal (subseq str 0 1) "[")(cons (obj_array (remove_braces str))nil))
(t (cons (subseq str 0 (search "," str))nil))))
(defun obj_c (str)
"{")
(defun obj_array (str)
(cond ((= 0 (length str))nil)
((null (search "," str))(cons (subseq str (+ (search "[" str)1)(- (length str)1))nil))
((and (null (search "[" str))(null (search "," str)))(cons str nil))
((null (search "[" str))(cons (subseq str 0 (search "," str))
(obj_array (subseq str (+ (search "," str) 1)))))
((cons (subseq str (+ (search "[" str) 1)(search "]" str))
(obj_array (subseq str (+ (search "," str) 1)))))))
(defun remove_space (str)
(cond ((= 0 (length str))nil)
((concatenate 'string (remove_aux str) (remove_space(subseq str 1))))))
(defun remove_aux (str)
(cond ((equal (subseq str 0 1) " ")"")
((concatenate 'string (subseq str 0 1) ""))))
(defun remove_backslash (str)
(cond ((= 0 (length str))nil)
((concatenate 'string (remove_slash str)(remove_backslash(subseq str 1))))))
(defun remove_slash (str)
(cond ((equal (subseq str 0 1) "\"")"")
((concatenate 'string (subseq str 0 1) ""))))
(defun remove_braces (str)
(subseq str 1 (- (length str) 1)))
(defun shorter (str)
(subseq str 1 (length str)))
这是我到现在为止得到的,这并不是完全错误的,因为我可以解析部分 json-string。我无法真正解析的是整个原因,因为我不知道如何传递新子序列的正确索引:
CL-USER 1 > (j-obj "{\"name\" : \"Zaphod\",\"heads\" : [[\"Head1\"], [\"Head2\"]]}")
(("name" "Zaphod"))
CL-USER 2 > (j-obj "{\"heads\" : [[\"Head1\"], [\"Head2\"]]}")
(("heads" ("Head1" "Head2")))
正确的输出应该是:
(("name" "Zaphod")("heads" ("Head1" "Head2")))
您不应从输入中删除有助于确定接下来会发生什么的字符。 {name:Zaphod,heads:[[Head1],[Head2]]}
不干净,无效JSON。 JSON 中的所有键必须是字符串,所有字符串都包含在 ""
中。 Head1
在 JSON 中无效。
干净地执行此操作的一种方法是首先标记字符串:
"{\"name\" : \"Zaphod\",\"heads\" : [[\"Head1\"], [\"Head2\"]]}"
产量
{
"name"
:
"Zaphod"
,
"heads"
:
[
[
"Head1"
]
,
[
"Head2"
]
]
}
parse-json
函数然后查看第一个标记:如果它是一个字符串,则生成一个字符串;否则如果它是一个数字,它会产生一个数字;如果它是一个布尔值,它会产生那个布尔值; …如果是 {
,它调用 parse-json-obj
;如果它是 [
,它调用 parse-json-array
。
Parse-json-obj
重复调用 parse-key-value
直到下一个标记是 }
,而不是 ,
。
Parse-key-value
解析字符串(否则出错),然后是 :
,然后调用 parse
获取值。
您可以通过从每个 parse* 函数返回其余部分作为第二个值来跟踪您在标记列表中的位置。
我开始编写下面的代码作为大学作业,其中包括在 Common Lisp 中解析 json 字符串。我现在面临的主要问题是获得正确的 substring\subsequence 以继续递归调用并解析字符串的其余部分。基本上主要思想是递归检查整个字符串。按照给定的语法,输入字符串应为:
1) "{\"nome\" : \"arturo\" , \"cognome\" : \"durone\" , \"età\" : \"22\" , \"corso\" : \"informatica\"}"
2) "{\"name\" : \"Zaphod\",\"heads\" : [[\"Head1\"], [\"Head2\"]]}"
3) "{\"name\" : \"Zaphod\",{property:value, property : [1,2,3] }
4) "[1,2,3]"
基本上我确实从字符串中删除任何 space 和任何 \" 得到一个干净的字符串 "{name:Zaphod,heads:[[Head1],[Head2]]}"
,在这里我检查 ':'
的位置并获取从 0 到((position ":")-1)
,第二部分也一样,但是当我必须传递给递归调用时,问题就来了,因为我不知道如何传递字符串的正确索引。
我试图检查函数在输出中给我的新列表的任何元素的长度,但它没有 work/help 因为字符串被拆分并且没有 space和初始输入中的 \"
个字符。你能帮我找到一种方法来按照递归方法解析 json 字符串的其余部分吗?
> main function
(defun j-obj (str)
(cond ((correct_form str)
`(json-obj-aux(revome_braces (remove_backslash(remove_space str)))))))`
> aux function that thru a recursive call analize the whole string
(defun json-obj-aux (str)
(cond ((= (length str) 0)nil)
((cons (aux_control str)nil))))
; (json-obj-aux (subseq (shorter str)(length (aux_control (shorter str)))
; (length (shorter str))))))))
> check the whole string , splitting once it finds ":"
(defun aux_control (str)
(cons (subseq str 0 (search ":" str))(check_type (subseq str (+ (search ":" str) 1) (length str)))))
(defun check_type (str)
(cond ((equal (subseq str 0 1) "{")(obj_c str))
((equal (subseq str 0 1) "[")(cons (obj_array (remove_braces str))nil))
(t (cons (subseq str 0 (search "," str))nil))))
(defun obj_c (str)
"{")
(defun obj_array (str)
(cond ((= 0 (length str))nil)
((null (search "," str))(cons (subseq str (+ (search "[" str)1)(- (length str)1))nil))
((and (null (search "[" str))(null (search "," str)))(cons str nil))
((null (search "[" str))(cons (subseq str 0 (search "," str))
(obj_array (subseq str (+ (search "," str) 1)))))
((cons (subseq str (+ (search "[" str) 1)(search "]" str))
(obj_array (subseq str (+ (search "," str) 1)))))))
(defun remove_space (str)
(cond ((= 0 (length str))nil)
((concatenate 'string (remove_aux str) (remove_space(subseq str 1))))))
(defun remove_aux (str)
(cond ((equal (subseq str 0 1) " ")"")
((concatenate 'string (subseq str 0 1) ""))))
(defun remove_backslash (str)
(cond ((= 0 (length str))nil)
((concatenate 'string (remove_slash str)(remove_backslash(subseq str 1))))))
(defun remove_slash (str)
(cond ((equal (subseq str 0 1) "\"")"")
((concatenate 'string (subseq str 0 1) ""))))
(defun remove_braces (str)
(subseq str 1 (- (length str) 1)))
(defun shorter (str)
(subseq str 1 (length str)))
这是我到现在为止得到的,这并不是完全错误的,因为我可以解析部分 json-string。我无法真正解析的是整个原因,因为我不知道如何传递新子序列的正确索引:
CL-USER 1 > (j-obj "{\"name\" : \"Zaphod\",\"heads\" : [[\"Head1\"], [\"Head2\"]]}")
(("name" "Zaphod"))
CL-USER 2 > (j-obj "{\"heads\" : [[\"Head1\"], [\"Head2\"]]}")
(("heads" ("Head1" "Head2")))
正确的输出应该是:
(("name" "Zaphod")("heads" ("Head1" "Head2")))
您不应从输入中删除有助于确定接下来会发生什么的字符。 {name:Zaphod,heads:[[Head1],[Head2]]}
不干净,无效JSON。 JSON 中的所有键必须是字符串,所有字符串都包含在 ""
中。 Head1
在 JSON 中无效。
干净地执行此操作的一种方法是首先标记字符串:
"{\"name\" : \"Zaphod\",\"heads\" : [[\"Head1\"], [\"Head2\"]]}"
产量
{
"name"
:
"Zaphod"
,
"heads"
:
[
[
"Head1"
]
,
[
"Head2"
]
]
}
parse-json
函数然后查看第一个标记:如果它是一个字符串,则生成一个字符串;否则如果它是一个数字,它会产生一个数字;如果它是一个布尔值,它会产生那个布尔值; …如果是 {
,它调用 parse-json-obj
;如果它是 [
,它调用 parse-json-array
。
Parse-json-obj
重复调用 parse-key-value
直到下一个标记是 }
,而不是 ,
。
Parse-key-value
解析字符串(否则出错),然后是 :
,然后调用 parse
获取值。
您可以通过从每个 parse* 函数返回其余部分作为第二个值来跟踪您在标记列表中的位置。